大数据,数据挖掘,数据分析,Big Data, Data Mining, Data Analysis

【大数据基础】VirtualBox安装CentOS实操

【大数据基础】VirtualBox安装CentOS实操
首先下载VirtualBox并安装,可在官网根据所使用的系统直接下载:https://www.virtualbox.org/wiki/Downloads。VirtualBox和一般的软件安装并没有什么差别,这里略过不提。注:本文中使用Mac OS X系统进行操作,但文中的方法也同样适用Windows系统安装完后打开VirtualBox,点击New添加虚拟……继续阅读 »

Alan 9年前 (2016-01-04) 6583浏览 0评论0个赞

本地安装Hadoop完整笔记

本地安装Hadoop完整笔记
网络设置首先在本地安装VirtualBox,然后添加CentOS虚拟机,都是常规安装,这里要稍加强调的是网络设置。打开对应机器的Settings>Network,然后配置网卡适配器为Bridged Adapter,Alan使用的是Mac采用无线上网,所以选择en0: Wi-Fi(Airport),另外请注意勾选下面的Cable Connected……继续阅读 »

Alan 9年前 (2015-12-28) 5905浏览 0评论0个赞

Hadoop学习笔记

Hadoop学习笔记
第一步:安装Linux第二步:安装JDKjavac查是否安装配置好了JDK,若未安装,以JAVA 7为例:再次输入javac若出现类似下面的提示则表明安装成功要在整个系统中使用JDK,还需要配置环境变量,首先打开/etc/profile下通过source /etc/pofile设置生效第三步:配置Hadoop首先需要下载Hadoop安装包,以1……继续阅读 »

Alan 10年前 (2015-06-16) 5225浏览 0评论0个赞

大数据的统计学基础

大数据的统计学基础
最近在看一本—数据挖掘与数据化运营实战:思路、方法、技巧与应用,读起来感觉很吃力,似乎这本书并不像其所称的那样适合“感兴趣的初学者”。在阅读的过程中发现在大数据这块的基础知识方面实际上是相当薄弱的,毕业太长什么方差矩阵之类虽很基础却都早已遗忘,所以再次求助万能的淘宝,决定先从一套名为《大数据的统计学基础》的视频开始学习,相信对于我刚刚开始入门的……继续阅读 »

Alan 10年前 (2015-03-25) 6956浏览 0评论0个赞

学习R读书笔记之向量、矩阵和数组

学习R读书笔记之向量、矩阵和数组
使用vector函数可创建指定类型和长度的矢量可通过seq来创建序列,seq.int(3,12)等价于3:12,该函数还有更为灵活的用法,除了指定序列的范围外还可指定步长如上面示例所示,该序列包含3到12之间步长为2的数字。seq_along则创建一个从1开始,长度为输入值的序列length()函数可查看向量的长度,nchar()函数可查看字符的长度……继续阅读 »

Alan 10年前 (2015-03-23) 5265浏览 0评论0个赞

学习R读书笔记

学习R读书笔记
大数据已被热炒多时,Map Reduce, Hadoop等也时常出现在各新闻中。R语言所说在数据分析和数据挖掘领域也有着优良的表现,于是购买了这本Richard Cotton所著的《学习R》一探究竟。一、安装篇笔者决定先在Windows上做一下测试,访问http://cran.r-project.org/bin/windows/base/下载安装文件……继续阅读 »

Alan 10年前 (2015-03-21) 4999浏览 0评论0个赞

数学符号大全

数学符号大全
最近想要了解一下有关大数据、数据挖掘方面的知识,强烈发现数学知识都还给中学老师了。本来学理科的,可是大学里愣是被“文科化”了,看到那些数学符号连名称都记不起来了,所以分别在百度和谷歌上搜了下相关的信息,放在这里以供查看。PEMDAS规则(运算符优先级):parentheses first, exponentiation second, multipli……继续阅读 »

Alan 10年前 (2015-03-20) 10427浏览 0评论0个赞