各二级学院:
为加强数据科学与大数据技术及其相关专业建设,培养我校学生大数据与人工智能技能、数据科学思维、实践能力和协作能力,提升我校大学生大数据与人工智能方面创新创业能力,以适应大数据与人工智能技术应用领域快速增长的人才需求。经研究,决定举办2025年铜陵学院大数据与人工智能应用竞赛暨安徽省大数据与人工智能应用竞赛网络赛。
现将有关事项通知如下:
一、大赛组织
本次竞赛由教务处主办,数学与计算机学院承办。
二、参赛对象
我校全日制本科在校生,鼓励跨专业组队参赛。校赛创意组可以以个人或团队方式(不超过3人)参加,其他组采用个人赛方式进行。
三、参赛报名
1、竞赛报名:扫描下方二维码在线填写报名信息。

2、报名日期:即日起 — 9月7 日。
3、竞赛时间及地点安排
竞赛开始时间: 9月10日 15:00
竞赛地点:逸夫楼5楼大数据实验室
四、竞赛内容
本次竞赛设大数据赛道和人工智能赛道两个赛道。
(一)大数据赛道
本赛道分为“本科软件组”和“创意组”。
(1)本科软件组竞赛内容分为大数据平台部署、大数据平台参数优化、大数据预处理、大数据分析、大数据可视化以及综合应用,具体包括:
大数据平台部署:参赛选手根据题目要求完成大数据平台的部署,包括但不限于Hadoop、HDFS、HBase、Hive、Spark、Zookeeper、Flink、Flume、KafKa、ClickHouse等,并能够根据要求对部署的平台参数进行调整以及测试平台可用性,对多个平台进行联调、联测,实现数据在不同的平台中进行流转。
大数据预处理:参赛选手根据题目要求对给定的数据(数据可能不完整、不一致、重复、含噪音等)进行预处理,使得数据准确、完整、一致、可用,并能够对数据格式进行转换以及完成初步统计任务。
大数据分析:参赛选手根据题目要求在已搭建好的大数据平台上进行数据的分析。
大数据可视化:参赛选手根据题目要求对给定数据进行可视化展示,并能对可视化结果进行解释说明。
综合应用:对给定的数据集,参赛选手综合应用大数据预处理、大数据分析与挖掘等技术,求解一个给定的问题。
(2)创意组竞赛分为四个主题:
主题1:教育领域大数据及人工智能应用
基于教育领域大数据,实现特定教育场景下的任务,对教育场景具有较好的实际应用价值和意义。 可以参照的思考维度包括并不限于(鼓励学生提出自己的思考维度): 1. 教学过程数据分析 2. 智能助教机器人 3. 教育资源建设 4. 智慧课堂管理 5. 教育管理的决策支持等。
主题2:医疗保健行业大数据及人工智能应用
基于医疗领域大数据,采用大数据和人工智能技术实现特定医疗保健行业中的任务,对医疗领域具有较好的实际应用价值和意义。
主题3:大模型相关应用
结合大模型的智能问答算法作品赛。此赛道以大模型为基础,可选择性结合自然语言处理、信息检索、知识图谱和机器学习等技术,以提供更智能、准确和人性化的答案。
主题4:其他行业大数据及人工智能应用
面向特定行业领域中的实际应用问题,基于行业数据及人工智能技术,探索应用场景并自行获取相关数据,最终提交具有原创性并能够进行可视化应用展示的参赛作品。
内容要求参赛作品须围绕大数据与人工智能核心技术,探索有具体落地场景的技术应用创意方案,如大数据与人工智能技术在工业、农业、医疗、文化、教育、金融、交通、公共安全、日常生活、公益等行业领域的应用探索。
竞赛采用开放命题,参赛作品须使用大数据与人工智能相关技术。参赛者应充分发挥创新能力,自由探索应用场景并自行获取相关数据,最终提交具有原创性并能够进行可视化应用展示的参赛作品。
(二)人工智能赛道
本赛道分为“本科软件组”和“硬件组”。
(1)本科软件组竞赛内容分为人工智能基础环境搭建部署、样本数据预处理、传统机器学习算法设计及应用、深度学习算法设计及应用、人工智能技术综合应用,具体包括:
人工智能基础环境搭建部署:参赛选手根据题目要求完成指定版本的人工智能相关开发环境的部署,包括但不限于Anaconda、深度学习库PyTorch、TensorFlow,并能够根据要求对部署的框架导入需要的相关库,包含但不限于sklearn,opencv。
样本数据预处理:对给定的样本数据(图片、文本或者数值数据),检测和去除数据集中的噪声数据、重复数据和无关数据,处理遗漏数据,去除空白数据域,标准化、归一化、二元化数据以及特征提取等处理。
传统机器学习算法设计及应用:典型传统机器学习算法的设计应用。包含但不限于逻辑回归、支持向量机、决策树、Kmeans等,根据题目或场景,通过选用机器学习算法利用Sklearn或者其它机器学习框架训练模型,实现分类、聚类算法并解决问题。
深度学习算法设计及应用:包括但不限于卷积神经网络、循环神经网络、对抗生成网络、强化学习算法等。根据题目或场景,通过选用深度学习相关算法,实现如图像、语音、文本分析等结构化/非结构化数据的识别检测等
人工智能技术综合应用:给定现实场景和数据集,综合运用人工智能相关技术解决给定问题。
(2)硬件组竞赛内容分为人工智能云端平台的使用、大模型离线部署的实现、大模型提示词的设计、大模型微调的实现、大模型的综合分析,具体包括:
人工智能云端平台的使用:登录指定的人工智能云端平台,在云端操作系统中完成基本命令,实现云端平台的文件上传下载等功能。(Linux、xshell、xftp等工具的基本使用)。
大模型离线部署的实现:将指定的大模型按要求安装部署到人工智能云端平台,部署后通过python代码能实现自然语言对话或图像识别、文本分类、语音识别等功能。
大模型提示词的设计:对给定的任务,考生自行设计大模型的提示词prompt模板。实现大模型的对话并能按照指定格式输出、生成包含指定物体的图片、传入图片、输出指定的描述信息等。
大模型微调的实现:加载给定的数据集,并对数据集进行预处理,利用代码或训练工具读取大模型,并对处理好的数据集进行微调训练。(包含:增量预训练、指令监督微调、奖励模型训练、PPO训练、DPO训练、KTO训练、ORPO等)
大模型的综合分析:总结分析能力,文档写作能力。能够从算力资源、训练推理、准确率等多方面对大模型任务的开发流程进行科学分析和构思,形成一整套可行的计划方案。
五、竞赛要求
软件组:
参赛队必须在指定的位置就坐和操作指定的计算机。
参赛队员可以携带诸如书、手册、程序清单等参考资料。
参赛队员不能携带任何可用计算机处理的软件或数据(不允许任何私人携带的U盘、磁盘或计算器)。
参赛队员不能携带任何类型的通讯工具,包括无线电接收器、移动电话。
在竞赛中,参赛队员根据题目要求完成相关工作,参赛队员不得和竞赛组委会指定工作人员以外的人员交谈,现场工作人员只能回答和处理与平台系统相关的问题。
参赛队员出现妨碍比赛正常进行的行为,诸如擅自移动赛场中的设备,未经授权修改比赛软硬件,干扰他人比赛等,取消其参赛资格。
竞赛的预定时间为2小时,但当竞赛进行一定时间后,竞赛专家组可以因为出现不可预见的事件而调整比赛时间长度,一旦比赛时间长度发生改变,将会以及时并且统一的方式通告所有参赛队员。
创意组:
初赛作品在报名期间或比赛截止前发送到邮箱:1498116930@qq.com,注意:作品报告务必以PDF格式发送。
六、竞赛环境
(一)大数据赛道
软件组:
参赛队员根据竞赛要求,使用指定的竞赛用电脑和竞赛平台。
操作系统:Centos
编程语言:Python、Java
Python语言开发环境采用PyCharm,Java语言开发环境采用idea。
创意组:
竞赛期间直接提交报告即可。
(二)人工智能赛道
软件组:
参赛队员根据竞赛要求,使用指定的竞赛用电脑和竞赛平台。
操作系统:Centos
编程语言:Python、Java
Python语言开发环境采用PyCharm,Java语言开发环境采用Eclipse。
硬件组:
参赛队员根据竞赛要求,使用指定的竞赛用电脑和竞赛平台(或自带)。
操作系统:Linux(centos / ubuntu)
大模型:deepseek、Qwen、LLama
编程语言:Python3
Python语言开发环境采用PyCharm,Java语言开发环境采用Eclipse。
七、联系信息
钱老师 联系电话:18356278360
曹老师 联系电话:13526583978
汪老师 联系电话:13705621869
大赛交流QQ群:所有参赛队员必须加入QQ群(781737093),相关比赛通知将通过QQ群及时发布。
八、奖项设定
本次校赛设置一、二、三等奖,其中,一、二、三等奖比例分别为参赛队伍的10%、20%和30%。学校将根据竞赛结果择优推荐作品参加安徽省大数据与人工智能应用竞赛。
教务处 数学与计算机学院
2025年7月29日
点击链接下载

