数据科学与大数据技术


一、培养目标

本专业培养大数据科学与工程领域的复合型高级技术人才。毕业生品格健全,具有科学的人文精神、创新创业精神和良好的职业道德精神,具备自主学习能力、批判思维能力,能够为地方大数据产业发展做出相应的服务。毕业生具有数据科学和计算科学基础知识与基本技能,掌握数据采集、存储、处理、分析、可视化的基本理论、基本方法和基本技术,能从事数据分析决策、大数据应用系统开发、数据可视化处理等工作。

毕业5年后学生:

1、能够针对大数据工程实施的具体环境和管理条件,理解和运用数据科学理论、计算机技术、软件工程技术、数据处理技术、统计分析技术、数据挖掘技术、行业技术规范等多学科知识,为工程实践提供理论及技术基础。(知识运用)

2、能在企业与社会环境下,从事数据的收集整理以及对海量数据分析处理,获得有效知识并加以应用等复杂工程活动,能够定义、研究和分析复杂问题,设计或开发解决复杂问题的方案,能够评估复杂活动的效果和影响,表现出很强的判断力,并承担决策的责任。(工程能力)

3、具有良好的人文科学素养、团队合作能力和较强的社会责任感。对于复杂活动合理性可预见的社会、环境、政治、伦理影响有基本认识,能够考虑到持续发展的需要;能够管理复杂活动的部分或全部,在工作过程中能与他人清晰明确地交流,遵守职业道德、相关的法律法规和行业规范,能够在工程实践中维护公共健康和安全。(综合素质)

4、能够通过足够的“持续职业发展”保持和拓展个人能力,具备一定的国际视野,熟悉大数据行业国内外发展现状和趋势,能适应大数据技术的发展以及职业发展的变化,成为所在单位相关领域的专业技术骨干或管理骨干。(职业发展)


二、毕业要求  

1、工程知识:具备良好的工程知识,能够将数学、数据科学、计算机科学、工程基础和专业知识用于解决大数据采集预处理、大数据存储、大数据分析、大数据可视化等大数据应用系统中的复杂工程问题。

1.1 具备解决大数据复杂工程问题所需的统计学思维能力及数学抽象、计算、建模及逻辑思维能力,能够用于工程问题的分析、建模和求解;

1.2 具备大数据工程开发所需要的计算机系统设计基础知识,能将工程和专业知识用于建立面向大数据应用的专业计算机系统;

1.3 能将工程和专业知识用于判别大数据应用系统的复杂性和选择合适的优化途径;

1.4 能够选择恰当的数学模型,用于描述业务领域内的分析预测过程,对模型进行推理和求解;

2、问题分析:能够应用数学、自然科学、计算机科学和工程科学的基本原理,识别、表达、并通过文献研究分析大数据应用系统设计或集成中的复杂工程问题,包括数据采集预处理、分布式数据存储、数据分析挖掘及可视化等,并提出解决方案,同时能对其合理性进行评价并获得有效结论。

2.1 能识别和判断复杂大数据工程问题的关键环节、步骤和参数;

2.2 能认识到解决复杂大数据工程问题有多种方案可选择;

2.3 能分析相关文献寻求可替代的解决方案;

2.4 能正确表达一个复杂大数据工程问题的解决方案;

2.5 能运用基本原理,对所提出的解决方案进行评价,进而验证解决方案的合理性,得出有效结论;

3、设计/开发解决方案:能设计、优化针对复杂大数据问题的解决方案,设计、优化满足用户需求的业务模型及计算机系统,并能够在设计环节中体现创新意识,考虑社会、健康、安全、法律、文化以及环境等因素。

3.1 能够根据用户需求或设计目标确定具体方案,包括硬件架构和软件平台、框架方案,并在设计过程中考虑社会、健康、安全、法律、文化以及环境等因素;

3.2 能设计数据采集方案,将分布的、异构数据源中的数据抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库或数据集市中,在设计过程中能考虑社会、健康、安全、法律、文化以及环境等因素;

3.3 能根据业务数据特征及设计目标,在众多分布式存储系统、并行计算框架中进行优选,从中体现创新意识;

3.4 能根据用户需求及设计目标,合理选择机器学习、数据挖掘模型,并对其进行优化改进,从中体现创新意识;

3.5 能根据用户需求及设计目标,确定可视化工具,并进行数据可视化、指标可视化、数据关系可视化、背景数据可视化方案的设计;

3.6 能用说明书、报告等形式,呈现设计成果;

4、研究:能基于数据科学、计算机科学、统计学原理和方法,对大数据工程问题进行研究,科学、合理地选择研究路线,设计可行的实验方案,对实验数据进行分析与解释、并通过信息综合得到合理有效的结论。

4.1 能对大数据复杂工程问题的解决方案进行研究和对比;

4.2 能基于数据科学、计算机科学理论,选择研究路线,设计可行的实验方案;

4.3 能够根据实验方案构建计算机实验系统,进行实验;

4.4 能正确采集、整理实验数据,对实验结果进行关联,建模、分析和解释,获取合理有效的结论;

5、使用现代工具:能开发、选择与使用恰当的技术、资源、现代工程工具和信息技术工具对大数据应用系统的复杂工程问题进行分析、预测、模拟与实现,并理解其局限性。

5.1 能针对复杂工程问题,分析其所需的相关计算机技术、资源和工具;

5.2 能获取、选择、开发相关的计算机技术、资源和工具,并用于复杂工程问题的解决;

5.3 能用现代计算机软硬件技术、资源与工具对结果进行预测与模拟,并理解其局限性。

6、工程与社会:能理解、分析、评价大数据应用工程实践和解决方案对社会、健康、安全、法律以及文化的影响,并理解应承担的责任。

6.1 熟悉与专业领域工程相关的技术标准、知识产权、产业政策和法律法规;

6.2 具有工程实习和社会实践的经历,了解数据科学与大数据技术相关的背景知识,能识别和分析计算机专业工程实践和复杂工程问题解决方案对社会、健康、安全、法律以及文化的潜在影响;

6.3 能客观评价计算机工程实践和复杂工程问题解决方案对社会、健康、安全、法律以及文化的影响,并理解应承担的责任。

7、环境和可持续发展:能理解和评价针对计算机网络系统中的复杂工程问题的工程实践对环境、社会可持续发展的影响。  

7.1 理解环境保护和社会可持续发展的内涵和意义;

7.2 能针对实际专业工程项目,分析其资源利用率、安全防范措施和社会效益,评价其对环境和社会可持续发展的影响。

8、职业规范:具有人文社会科学素养、社会责任感,能在计算机领域内各类工程实践中理解并遵守工程职业道德和规范,履行责任。  

8.1 尊重生命,关爱他人,主张正义,诚信守则,具有人文知识、思辨能力、处事能力和科学精神;

8.2 了解国情,维护国家利益,具有推动社会进步的责任感;

8.3 理解工程师的职业性质和责任,在工程实践中能自觉遵守职业道德和规范,具有法律意识。

9、个个人和团队:能在多学科背景下的团队中承担个体、团队成员以及负责人的角色。

9.1 能主动与其他学科的成员合作开展工作,能独立完成团队分配的任务;

9.2 能组织团队成员开展工作,倾听其他团队成员的意见;

9.3 能胜任团队成员的角色与责任。

10、沟通:能够就大数据技术中复杂工程问题与业界同行及社会公众进行有效沟通和交流,包括撰写报告和设计文稿、陈述发言、清晰表达,或回应指令,并具备一定的国际视野,能在跨文化背景下就复杂工程问题进行有效沟通和交流。

10.1 掌握一门外语应能用于沟通;

10.2 能够就专业领域的复杂工程问题与业界同行及社会公众进行有效沟通和交流,包括撰写报告和设计文稿、陈述发言、清晰表达或回应指令;

10.3 了解国际本行业发展动态,关注本专业国际热点问题。

11、项目管理:理解并掌握工程项目管理原理与经济决策方法,并能在多学科环境中应用。

11.1 能理解并掌握工程项目管理、经济决策的整体框架;理解工程项目的时间及成本管理、质量及风险管理以及人力资源管理,并应用于多学科环境的工程实践中;

11.2 理解并掌握工程项目安全管理。

12、终身学习:具有自主学习和终身学习的意识,能通过不断学习,适应社会发展和技术进步。

12.1 能认识不断探索和学习的必要性,具有自主学习和终身学习的意识;

12.2 具备终身学习的知识基础,掌握自主学习的方法,了解拓展知识和能力的途径;

12.3 能针对个人或职业发展的需求,采用合适的方法,自主学习,适应发展。


三、主要课程

概率论、统计学基础、数据结构与算法、数据库原理与应用、Python与数据分析、数据采集与预处理、机器学习与数据挖掘、大数据分布并行处理、大数据可视化技术。


四、就业方向

本专业毕业的学生能在金融机构、电子商务、教育领域、科技领域、企事业单位、服务行业从事与大数据相关的数据处理、数据分析、大数据系统开发、数据可视化等相关等工作。