大数据基础工程师培训一般学习多长时间?

在正式开始本内容之前,需要先从github下载相关代码,搭建好一个名为mysql_shiyan的数据库(有三张表:department,employee,project),并向其中插入数据。
具体操作如下,首先输入命令进入tmp目录:
然后再输入命令,下载代码:
git clone http://git.shiyanlou.com/shiyanlou/SQL6
下载完成后,输入&cd ~&(注意有空格)退回到原先目录,然后输入命令开启MySQL服务并使用root用户登录:
sudo service mysql start
刚才从github下载的SQL6目录下,有个两文件&MySQL-06.sql&和&in.txt&,其中第一个文件用于创建数据库并向其中中插入数据,第二个文件用于之后的实验步骤。
(你可以进入/tmp/SQL6目录用Gedit查看里面两个文件的内容。)
输入命令运行第一个文件,搭建数据库并插入数据:
source /tmp/SQL6/MySQL-06.sql
索引是一种与表有关的结构,它的作用相当于书的目录,可以根据目录中的页码快速找到所需的内容。 当表中有大量记录时,若要对表进行查询,没有索引的情况是全表搜索:将所有记录一一取出,和查询条件进行一一对比,然后返回满足条件的记录。这样做会消耗大量数据库系统时间,并造成大量磁盘I/O操作。 而如果在表中已建立索引,在索引中找到符合查询条件的索引值,通过索引值就可以快速找到表中的数据,可以大大加快查询速度。
对一张表中的某个列建立索引,有以下两种语句格式:
ALTER TABLE 表名字 ADD INDEX 索引名 (列名);
CREATE INDEX 索引名 ON 表名字 (列名);
我们用这两种语句分别建立索引:
ALTER TABLE employee ADD INDEX idx_id (id);
#在employee表的id列上建立名为idx_id的索引
CREATE INDEX idx_name ON employee (name);
#在employee表的name列上建立名为idx_name的索引
索引的效果是加快查询速度,当表中数据不够多的时候是感受不出它的效果的。这里我们使用命令&SHOW INDEX FROM 表名字;&查看刚才新建的索引:
在使用SELECT语句查询的时候,语句中WHERE里面的条件,会自动判断有没有可用的索引。
视图是从一个或多个表中导出来的表,是一种虚拟存在的表。它就像一个窗口,通过这个窗口可以看到系统专门提供的数据,这样,用户可以不用看到整个数据库中的数据,而只关心对自己有用的数据。
注意理解视图是虚拟的表:
数据库中只存放了视图的定义,而没有存放视图中的数据,这些数据存放在原来的表中;
使用视图查询数据时,数据库系统会从原来的表中取出对应的数据;
视图中的数据依赖于原来表中的数据,一旦表中数据发生改变,显示在视图中的数据也会发生改变;
在使用视图的时候,可以把它当作一张表。
创建视图的语句格式为:
CREATE VIEW 视图名(列a,列b,列c) AS SELECT 列1,列2,列3 FROM 表名字;
可见创建视图的语句,后半句是一个SELECT查询语句,所以视图也可以建立在多张表上,只需在SELECT语句中使用子查询或连接查询,这些在之前的实验已经进行过。
现在我们创建一个简单的视图,名为&v_emp,包含v_name,v_age,v_phone三个列:
导入操作,可以把一个文件里的数据保存进一张表。导入语句格式为:
LOAD DATA INFILE '文件路径' INTO TABLE 表名字;
现在 /tmp/SQL6 目录下有一个名为&in.txt&的文件,我们尝试把这个文件中的数据导入数据库&mysql_shiyan&的&employee&表中。
先按住&Ctrl+Z&退出MySQL,再使用命令&gedit /tmp/SQL6/in.txt&查看&test.txt&文件中的内容:
再使用以下命令以root用户登录数据库,再连接&mysql_shiyan&数据库:
mysql -u root
use mysql_shiyan
查看一下没有导入数据之前,employee表中的数据:
现在执行导入语句,文件中的数据成功导入employee表:
导出与导入是相反的过程,是把数据库某个表中的数据保存到一个文件之中。导出语句基本格式为:
SELECT 列1,列2 INTO OUTFILE '文件路径和文件名' FROM 表名字;
注意:语句中 &文件路径& 之下不能已经有同名文件。
现在我们把整个employee表的数据导出到 /tmp 目录下,导出文件命名为&out.txt&具体语句为:
SELECT * INTO OUTFILE '/tmp/out.txt' FROM
用gedit可以查看导出文件 out.txt 的内容:
数据库中的数据或许十分重要,出于安全性考虑,在数据库的使用中,应该注意使用备份功能。
备份与导出的区别:导出的文件只是保存数据库中的数据;而备份,则是把数据库的结构,包括数据、约束、索引、视图等全部另存为一个文件。
mysqldump是MySQL用于备份数据库的实用程序。它主要产生一个SQL脚本文件,其中包含从头重新创建数据库所必需的命令CREATE TABLE INSERT等。
使用mysqldump备份的语句:
mysqldump -u root 数据库名&备份文件名;
我们尝试备份整个数据库&mysql_shiyan,将备份文件命名为&bak.sql,先&Ctrl+Z&退出MySQL,再使用语句:
mysqldump -u root mysql_shiyan & bak.
使用命令&ls&可见已经生成备份文件bak.sql:
你可以用gedit查看备份文件的内容,可以看见里面不止保存了数据,还有所备份的数据库的其他信息。
用备份文件恢复数据库,其实我们早就使用过了。在本次实验的开始,我们使用过这样一条命令:
source /tmp/SQL6/MySQL-06.sql
这就是一条恢复语句,它把MySQL-06.sql文件中保存的mysql_shiyan数据库恢复。
还有另一种方式恢复数据库,但是在这之前我们先使用命令新建一个空的数据库 test:
mysql -u root
再次&Ctrl+Z&退出MySQL,然后输入语句进行恢复,把刚才备份的&bak.sql&恢复到test&数据库:
mysql -u root test & bak.sql
我们输入命令查看tset数据库的表,便可验证是否恢复成功:
mysql -u root
可以看见原数据库的4张表和1个视图,现在已经恢复到test数据库中:
再查看employee表的恢复情况:
阅读(...) 评论()大数据挖掘研发培训一般学习多长时间?_百度知道
大数据挖掘研发培训一般学习多长时间?
没基础的话五个月也就足够了这类课程一般需要五个月,可以去魔据,不错,一般要五个月左右,每家有所不同,而且和你的自身基础情况都有很大的关系
采纳率:100%
为您推荐:
其他类似问题
换一换
回答问题,赢新手礼包
个人、企业类
违法有害信息,请在下方选择后提交
色情、暴力
我们会通过消息、邮箱等方式尽快将举报结果通知您。扫码下载官方App
3个月项目实战,零基础掌控大数据
- 课程由国际知名教育集团Wiley开发,并由Boolan博览网结合国内应用扩充,面向国际,落地本土 -
海内外的导师团队
1、具有程序设计基础经验,包括了解面向对象编程的概念、脚本语言和概率论基础知识;
2、 熟悉Linux/Unix 操作系统基本操作;
3、拥有Java 程序设计基础经验;
4、熟悉基本的 SQL 语句;
大数据大咖直播秀
证书由网易云课堂颁发。现已获得猎聘网、Linkedin(领英)、周伯通等求职招聘渠道的认可,您获得证书后可一键添加至这些网站。
证书代表你通过坚持不懈、律己刻苦的学习,系统地掌握了本专业的全部知识,能独立完成相关项目的开发,比单个课程证书更具含金量。
每一张证书都会绑定着学习者的真实身份,审核身份证号和姓名的唯一性,可录入证书号和二维码进行验真查询。
Q: 课程是录播还是直播?
A: 课程采取录播视频+线上作业+直播答疑的形式,你可以自主安排时间学习教学视频;但需在规划的学习周期内完成作业和参加考试。
Q: 作业如何提交?
A: 课程开始之后,学员通过我的学习中心进入线上教室,其中有作业一栏,老师会在规定时间公布作业,学员直接参与即可。
Q: 如果考试通不过怎么办?
A: 我们为考试不通过的学员提供一次重修机会,但是成绩为空或是中途放弃学习同学,不予以重修机会。重修请发邮件至: ease.com,注明重修申请。
Q: 如何申请微专业证书?
A: 按规定完成学习和作业考核,并且综合成绩合格,即可在学习结束后申请微专业证书。提交申请后需要支付¥30.00(包含证书制作、邮寄费用,不支持开具发票)
Q: 有问题,该如何咨询?
A: 您可以咨询主办机构Boolan博览网 (Boolan.com) 的客服qq:,或者发送邮件至
网易公司(163.com)旗下实用技能学习平台。与优秀讲师、专业机构、院校合作,为您提供海量优质课程,以及创新的在线学习体验,帮助您获得全新的个人发展和能力提升。
关注我们:
& 网易公司 版权所有鎴戜滑鐨勬湇鍔}

我要回帖

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信