英文取名
2022/09/11阅读:44主题:默认主题
大学生毕业论文题目写作风格赏析
引言
每到大学生毕业论文开题的时间,为了选择不落俗套的题目而抓耳挠腮。本文以2022届计算机学院的毕业论文为研究对象,以可视化的方式归纳分析不同专业的论文题目写作风格及研究方向。
运行环境
数据格式为CSV,共671条,字段信息有:论文题目、关键词、专业名称。专业包括有信息工程,教育技术学,数字媒体技术,物联网工程,计算机科学与技术,软件工程和通信工程。
-
Jupyter Notebook -
Plotly Express -
Pkuseg 中文分词工具包 -
Pandas
写作风格分析
各专业论文题目统计
图例中各统计指标表示含义: median:标题长度的中位数 mean:平均标题长度 min:标题最短字符数 max:标题最长字符数 其中字符数的统计含中文,英文(每个字母计量一个单位)和标点符号(如《》)。
-
先敲重点,列表 (见后)中的题目有哪些亮点?
列表题目中均含有英文专有名词,但是首字母小写是错误写法。除了x86这样约定俗成的专有名词之外,其他英文单词均需要首字母大写!首字母大写!首字母大写!有些甚至是全部大写,如MVC,STM32,PRA。
import pandas as pd
pd.options.mode.chained_assignment = None # default='warn'
file_path=r'2022--计信毕业论文.csv'
df=pd. read_csv (file_path,encoding='utf-8-sig',low_memory=False)
df = df.dropna(subset=['论文题目'])#去除论文题目为空的数据行
mask = (df['题目分词'].apply(lambda x:any( c[0].islower() for c in x.split()))) #查找首字母小写的英文单词
df=df[mask][['证书专业名称','论文题目']]
df
index | 证书专业名称 | 论文题目 |
---|---|---|
1 | 通信工程 | 基于python-opencv的人脸识别算法设计与实现 |
206 | 通信工程 | 基于javaweb的在线考试系统 |
209 | 通信工程 | 基于springboot的新冠数据查询 |
-
各专业论文标题的平均长度和中位数值接近,说明标题长度分布合理,无较大落差。
-
教育技术学专业的论文平均长度明显大于其他专业,主要是该专业针对具体的课程进行研究,因此书名号《》和课程名在论文标题中占比较高。
-
标题的最短长度统计,除了数字媒体技术专业(10个字符),其他专业的标题最短长度接近(7个字符)。
-
标题的最长长度统计,计算机科学与技术专业以42个字符的标题长度独占鳌头,其他专业的标题最长长度都在30个字符左右。
-
最长长度的论文题目
index | 证书专业名称 | 论文题目 |
---|---|---|
494 | 计算机科学与技术 | 基于SpringBoot和mybatis-plus框架的校园食堂订餐系统的设计与实现 |
-
较短长度的论文题目
index | 证书专业名称 | 论文题目 |
---|---|---|
190 | 通信工程 | 5G技术研究 |
467 | 计算机科学与技术 | 农产品销售商城 |
502 | 物联网工程 | 低代码开发平台 |
573 | 信息工程 | 净水器控制系统 |
各专业论文数量分布

各专业论文题目的Top15关键词分布
先整体了解Top15关键词在所有专业的分布情况
1、上图看出,除了教育技术学专业外,关键字“基于”,“系统”,“设计”,“实现”在各其他专业均占很大的比例,一方面说明工科学生的动手能力都是杠杠的,另一方面也反映出大家喜欢拿Web或桌面系统的开发实现作为自己的毕业选题,如果想让自己的毕设不落俗套,就尽量选择其他的研究重点。 2、除了研究内容上有变化外,毕业题目的用词也避免缺乏新意。推荐清华大学人工智能研究院的产品万词王,可以根据意思反向查找词语,可以避免表达形式的单一性。 3、教育技术学专业的毕业生多用的关键词是:教学、信息、应用等,这些反映学生侧重信息技术在教育教学中的应用。
再看看各个专业中的Top15关键词的分布:
from collections import Counter
import pandas as pd
file_path=r'毕业论文-2.csv'
df=pd. read_csv (file_path,encoding='utf-8-sig',low_memory=False)
df = df.dropna(subset=['论文题目'])#去除论文题目为空的数据行
grouped = df.groupby('证书专业名称')
lst_df=[]
for name, group in grouped:
lst=[]
for x in group['题目分词'].values.tolist():
lst.extend(x.split())
# #第一种方法
# d={i:lst.count(i) for i in set(lst)}
# df_group=pd.DataFrame(d.items(), columns=['word', 'count'])
#第二种方法
d=dict(Counter(lst))
df_group=pd.DataFrame(d.items(), columns=['word', 'count'])
df_group['name']=name
lst_df.append(df_group)
df = pd.concat(lst_df)
df
#pivot_cht_html(df,'data.html')
列表
index | 证书专业名称 | 论文题目 |
---|---|---|
1 | 通信工程 | 基于python-opencv的人脸识别算法设计与实现 |
206 | 通信工程 | 基于javaweb的在线考试系统 |
209 | 通信工程 | 基于springboot的新冠数据查询 |
338 | 通信工程 | 基于python的车牌识别系统设计与实现 |
435 | 通信工程 | 基于springboot+netty的网络通信系统 |
438 | 通信工程 | 基于springBoot+netty的网络通讯软件设计与实现 |
461 | 通信工程 | 基于python的信号与系统实验教学平台设计与实现 |
30 | 软件工程 | 基于java的房屋租赁系统的设计与实现 |
181 | 软件工程 | 基于android的网上购物APP微信小程序的开发与实现 |
256 | 软件工程 | 基于uni-app的电影计划小程序的设计与实现 |
422 | 软件工程 | 基于x86架构的宏内核操作系统的实现 |
11 | 计算机科学与技术 | 基于ssm框架的选课系统的设计与开发 |
41 | 计算机科学与技术 | 基于springboot的后台管理系统 |
44 | 计算机科学与技术 | 基于springboot的办公自动化系统设计与实现 |
90 | 计算机科学与技术 | 基于web的美妆商城的设计与实现 |
99 | 计算机科学与技术 | 基于springboot和微信小程序的点餐系统设计与实现 |
108 | 计算机科学与技术 | 基于web的社区宠物诊疗系统 |
132 | 计算机科学与技术 | 基于springboot的学校教材订购系统的设计与实现 |
135 | 计算机科学与技术 | 基于springboot的流浪动物管理系统的设计与实现 |
136 | 计算机科学与技术 | 基于java的学生选课系统的设计与实现 |
167 | 计算机科学与技术 | 基于ssm的医院在线预约系统的开发 |
175 | 计算机科学与技术 | 基于python的新冠疫情实时数据统计及可视化 |
216 | 计算机科学与技术 | 基于web的在线竞价系统的设计与实现 |
240 | 计算机科学与技术 | 基于排序算法的回合制游戏《thunderclap》的设计与开发 |
287 | 计算机科学与技术 | 基于web的小型酒店管理系统的设计与实现 |
316 | 计算机科学与技术 | 基于Bloom filter的视频过滤系统的设计和实现 |
342 | 计算机科学与技术 | 基于java的在线商城的设计与实现 |
349 | 计算机科学与技术 | 基于ssm的基层党员之家建设平台 |
358 | 计算机科学与技术 | 基于MVC模式的web图书管理系统设计与实现 |
360 | 计算机科学与技术 | fec算法在实时数据传输中的应用设计与实现 |
363 | 计算机科学与技术 | 基于java微服务在线视频教育系统设计与开发 |
365 | 计算机科学与技术 | 基于unity3D的移动增强现实与人机交互技术设计与实现 |
366 | 计算机科学与技术 | 基于linux操作系统的聊天软件的设计与开发 |
374 | 计算机科学与技术 | 基于python的高校网络舆情分析系统设计与实现 |
395 | 计算机科学与技术 | 基于python的贪吃蛇游戏设计 |
415 | 计算机科学与技术 | 基于springboot技术的足球场管理系统的设计与实现 |
417 | 计算机科学与技术 | 基于python的疫情数据分析和可视化的设计与实现 |
430 | 计算机科学与技术 | 基于python的食品推荐系统设计 |
443 | 计算机科学与技术 | 基于unity3D引擎的射击游戏开发与实现 |
494 | 计算机科学与技术 | 基于SpringBoot和mybatis-plus框架的校园食堂订餐系统的设计与实现 |
523 | 计算机科学与技术 | 一种分布式定时调度中间件My-trigger的设计与实现 |
525 | 计算机科学与技术 | 基于maven+SSM架构一站式城镇商品一体化web服务 |
526 | 计算机科学与技术 | 统计云与rpa应用研究 |
527 | 计算机科学与技术 | 基于统计人才队伍培养模式的创新与rpa应用研究 |
531 | 计算机科学与技术 | 中国国民经济核算体系与rpa应用研究 |
532 | 计算机科学与技术 | 统计监督职能研究与rpa应用研究 |
560 | 计算机科学与技术 | 基于web的作业系统设计与实现 |
572 | 计算机科学与技术 | 基于web的学生宿舍管理系统 |
600 | 计算机科学与技术 | 基于ssm的校园点餐系统设计 |
602 | 计算机科学与技术 | 基于uni-app单词学习系统的研究与设计 |
606 | 计算机科学与技术 | 基于ssm猫咖管理系统设计与实现 |
608 | 计算机科学与技术 | 基于ssm的电影票订购系统的实现 |
610 | 计算机科学与技术 | 基于springboot的房屋租赁管理系统设计与实现 |
648 | 计算机科学与技术 | 基于app的奶茶点单系统的设计与实现 |
649 | 计算机科学与技术 | 基于vue和node.js外卖平台设计与开发 |
652 | 计算机科学与技术 | 基于springboot的电影订票购票系统的设计与实现 |
202 | 物联网工程 | 基于vue超市商品管理系统 |
238 | 物联网工程 | 基于java的图书管理系统的设计与实现 |
385 | 物联网工程 | 基于opencv的人脸识别系统的设计与实现 |
396 | 物联网工程 | 基于thinkphp的个人博客的设计 |
397 | 物联网工程 | 基于jsp的排课系统的设计与实现 |
398 | 物联网工程 | 基于python的外卖平台的数据可视化 |
626 | 物联网工程 | 基于python的商品销售管理系统的设计与实现 |
627 | 物联网工程 | 基于ssm的校园流浪猫管理系统的设计与实现 |
628 | 物联网工程 | 基于java web的校园每日疫情通报系统设计与实现 |
629 | 物联网工程 | 基于vue.js的购物网站设计与实现 |
630 | 物联网工程 | 基于ssm的水果商城系统的设计与实现 |
639 | 物联网工程 | 基于web的题库管理系统设计与实现 |
250 | 数字媒体技术 | 转描技术在二维动画《king》中的应用研究 |
484 | 教育技术学 | 基于steam理念的初中信息技术课程教学设计与研究 |
485 | 教育技术学 | 基于steam的高中人工智能教学设计研究--以黄石X中为例 |
488 | 教育技术学 | 基于mpython的高中创客教学设计与实践研究 |
293 | 信息工程 | 基于stm32的智能路灯管理系统 |
541 | 信息工程 | 基于python爬虫的新闻管理系统开发 |
575 | 信息工程 | 基于python进行的web自动化测试 |
667 | 信息工程 | python可视化国内疫情大数据分析 |
作者介绍