通过前面几篇,相信就算是新手也对R语言的历史,R运行环境有了大概的了解。下面就R语言特殊的赋值符号与基本数据元素——向量做简要概述。 1、赋值符号 相信大家学过的编程语言中,赋值符号都是“ = ”。当然了,在R语言中用“ = ”是可以的,但却被视为一种不好的编程习惯,大家都知道,一个好的编程习惯是一个写代码的人基本编程素养的体现。在R语言中提倡用神奇的赋值符号“ <- ”。 这里给变量a,b分别赋值5,2 > a <- 5 > b <- 2 > a[1] 5 > b[1] …
通过前面几篇,相信就算是新手也对R语言的历史,R运行环境有了大概的了解。下面就R语言特殊的赋值符号与基本数据元素——向量做简要概述。 1、赋值符号 相信大家学过的编程语言中,赋值符号都是“ = ”。当然了,在R语言中用“ = ”是可以的,但却被视为一种不好的编程习惯,大家都知道,一个好的编程习惯是一个写代码的人基本编程素养的体现。在R语言中提倡用神奇的赋值符号“ <- ”。 这里给变量a,b分别赋值5,2 > a <- 5 > b <- 2 > a[1] 5 > b[1] …
最近有个需求,实时统计pv,uv,结果按照date,hour,pv,uv来展示,按天统计,第二天重新统计,当然了实际还需要按照类型字段分类统计pv,uv,比如按照date,hour,pv,uv,type来展示。这里介绍最基本的pv,uv的展示。 id uv pv date hour 1 155599 306053 2018-07-27 00 2 255496 596223 2018-07-27 01 ... ... ... ... ... 10 10490270 12927245 2018-07-27 10 关于什…
1、什么是Hive Hive是由Facebook开源用于解决海量结构化日志的数据统计。 Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。 本质是:将HQL转化成MapReduce程序 1)Hive处理的数据存储在HDFS 2)Hive分析数据底层的实现是MapReduce 3)执行程序运行在Yarn上 2、Hive优缺点 优点: 1) 操作接口采用类SQL语法,提供快速开发的能力(简单、容易上手)。 2) 避免了去写MapReduce,减少开发人员的学习成本…
1. Hive简介 hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。 其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析。 2. Hive的安装 安装hive前请确保已经安装好hadoop集群,通常使用mysql作为hive的元数据库,所以需要安装mysql。 我的hadoop集群是用3台虚拟机搭建的,分…
这里,分享一个自己第一次的赚钱案例! 记得大三时候出去实习,我们数学院是在武汉的一个培训机构学习一个月,主要是学Python及大数据基础。说是实习,其实是没有工资的,毕竟是别人给我们上课,怎么还会给我们发工资! 我爱学习,晚上回来便会看腾讯课堂的Python课程直播,重要免费!顺便说一下,腾讯课堂直播的套路就是:直播免费课程质量非常高,然后后面付费课程质量一般!有一个直播老师说去年也就是2016年,有一个学生,自己做课程,月入上万,当时我就心动了! 当然,这只是当时的一个想法! 着手开始做 回到学校后,我就开始着手…
R软件是一款集成了数据操作、统计和可视化功能的优秀的开源软件。R软件具备高效的数据处理和存储功能,擅长数据矩阵操作,提供了大量适用于数据分析的工具,支持各种数据可视化输出。R软件的一大优势是分析人员可利用简单的R程序语言描述处理过程,以构建强大的分析功能。此外,R软件具备良好可扩展性,来自世界各地开源社区的研究者为其提供了各种丰富的工具包。由于R软件能结合各种挖掘算法,有效地简化数据分析过程,适用于数据挖掘领域。 R语言的前世今生 R是统计领域广泛使用的诞生于1980年左右的S语言的一个分支。可以认为R是S语言的一…