应用场景
需要为不同角色的用户分别提供管理系统用于管理资源。
整体架构
整体架构如图所示:
数据存储需求是:每天会生成大量文章数据,每条文章数据包含标题、内容、URL、发表时间等多个字段,数据后续不会更新,因此考虑使用Hive作为数据仓库存储这些数据。以下介绍使用Hive存储数据的实践步骤以及注意事项。
下载jdk-7u79-linux-x64.tar.gz至/usr/local目录,解压并创建软连接:
tar -zxvf jdk-7u79-linux-x64.tar.gz
ln -s jdk1.7.0_79 jdk
在/etc/profile中增加环境变量:
export JAVA_HOME=/usr/local/jdk
export CLASSPATH=./:$JAVA_HOME/lib:$JAVA_HOME/lib/tools.jar
export PATH=$JAVA_HOME/bin:$PATH
重新打开shell,输入“java -version”,如下图所示,说明jdk1.7安装成功。
Storm集群如图所示:
其中包含一个nimbus节点和多个supervisor节点:
PostgreSQL与MySQL类似,也是一款开源、免费数据库。PostGIS是一款PostgreSQL插件,为PostgreSQL提供GIS支持。在开发页面点击热力图时,需要以(x,y)坐标方式存储点击位置,所以使用PostgreSQL+PostGIS存储点击数据。