首页 > 代码库 > 【学生研究课题】CSDN博客数据获取、分析、分享

【学生研究课题】CSDN博客数据获取、分析、分享

题记

    这次《对象程序设计》课程设计,一共给定了8个选题(下载WORD版,PDF版),以及自由选题的机会。从大家初步选题结果来看(图1),绝大部分同学选择了“图形用户界面的计算器”,较少同学选择了3-8题中的一个。一方面,可以看出大家目前的动手能力还有待提高,教师的教学水平还不能给予学生较多的帮助;另一方面,学生缺乏“主动选择、对自己负责”的能力,和从小学到大学一直是被动学习状态有关。李雅卿老师的《乖孩子的伤最重》(豆瓣,京东)中一篇文章“学习是对自己负责的事”,应该从小就让每一个学习者逐步培养自身的主动学习主动选择的能力,进而《学会生存》。

图1:课程设计学生选题分布

    其实布置后面几道选题(4-8),是希望学生能够通过实际的题目来提高自己的整体编程水平。下面以“七:CSDN博客数据的手机与整理程序”为例,阐述自己的出题构想。


CSDN博客数据的收集与整理程序

一:目的

(1)根据获得的数据,是否能够对教师的“因材施教”提供建议与帮助?
(2)每个人的学习速度、喜欢内容、专注度等都有差异,怎样才能够让班级同学在学习中学有所获?怎样组建班级学习小组等。

……

二:思考

(1)获取数据的目的是什么?
(2)每一个数据应该怎样去解读?如 文章的阅读量是否与作者的态度、文章的质量相关(相关性在70%以上,教师的博文例外)。
(3)除了这样单个信息的获取,是否有更好的方式?如使用API。HTML是一种层次结构,我们应该尽可能的做到通用化(在已经能够了解通过文本查找获取数据后)。
(4)数据随时间的变化,能够告诉我们什么?如阅读量的变化,或许可以表明文章的相对价值。
……

三:单用户数据分析

(1)获得每个用户的积分、原创文章(转载文章)等数目。
(2)获得每个用户每篇文章的 标题、发布时间、阅读次数、评论次数。

……
?

四:多用户数据分析

(1)同一题作业的班级同学完成时间分析。
(2)同一题作业中,除了共同部分外,差异性体现。如是否使用了程序编辑框、是否有结果说明、是否有自己的总结与评论、正文的链接数(如引用他人网页来辅助学习,见博文示例——第三周作业-实现随机点名的签到程序 第五需求,头像版 ,出色的作者一定会有较多的引用行为,因为这是一种主动学习的表征之一,特别是计算整个博客博文的引用)。

……

五:后续进展

(1)总结自己所做的工作。总结是一种高效的学习方式,是分享的前提。
(2)分享自己的收获、经验、体会等,如发表到CSDN博客,可以参加CSDN博文大赛(7月10日截止,投“云计算”模块 ),参赛本身会给我们很多收获,如果能够晋级到决赛,也许你的收获会更大,认识到很多朋友,甚至是CSDN里的工作人员,获得实习机会等。
(3)整理成科技论文发表,则进入到另一个领域。老师写博文较有经验,但写科技论文则是另外一回事,搜索百度学术(如搜索博客行为数据分析)。
(4)与其他同学或成员合作,弥补自身不足,深入数据分析(如博文相似度检测)。
(5)明白博文数据的限制,如果还需要更加准确的分析,我们还需要了解哪些资料?
……


    好的博文,是不断提炼、思考、修改出来的。小到标点、符号的应用,图表的使用;大到文章的结构、大意,对读者的启发与思考等。而我们对博文的分析,也可以使用适当的数据来把握这些行为,从而提升自己的认知。