array(35) { ["id"]=> string(4) "2060" ["type"]=> string(6) "course" ["title"]=> string(57) "“找的就是你”——文本分析与相似度计算" ["subtitle"]=> string(0) "" ["creator"]=> array(6) { ["id"]=> string(1) "3" ["nickname"]=> string(5) "admin" ["title"]=> string(1) " " ["uuid"]=> string(40) "634d3b58166bfafd4069119be97ee6bfee064c52" ["destroyed"]=> string(1) "0" ["avatar"]=> array(3) { ["small"]=> string(75) "http://www.chinadatacase.com/files/user/otherform/1711697442_1722994936.png" ["middle"]=> string(75) "http://www.chinadatacase.com/files/user/otherform/1711697442_1722994936.png" ["large"]=> string(75) "http://www.chinadatacase.com/files/user/otherform/1711697442_1722994936.png" } } ["showable"]=> string(1) "1" ["buyable"]=> string(1) "1" ["summary"]=> string(1126) "

本实验案例来源于教学实践,基于Python实现学生实验报告实验结论的文本相似度计算,以计算结果为依据得到实验结论评分权重,以更好体现学生实践成果,杜绝抄袭现象。案例遵循CRISP-DM数据挖掘标准流程,以学生的实验报告数据为输入,使用Python完成各项实验环节,最终计算出实验报告的评分权重。案例数据源为当届学生的《Python语言程序设计》课程实验报告,首先通过docx库获取学生实验报告文档中的实验结论,完成数据收集,接着进行数据清洗和数据预处理,使用jieba包完成分词并进行词频统计,基于词频统计结果进行文本内容描述统计和可视化分析,接着抛出问题,引出TF-IDF词向量相关内容,再引导学生实现TF-IDF算法,并对比可视化结果,最后使用词向量生成学生实验结论的文本相似度矩阵,再基于相似度矩阵进行学生实验结论相似性的统计分析,引导学生采用合适的方式给出基于相对分数的学生实验报告相似度的评分权重。

" ["minPrice"]=> string(4) "0.00" ["maxPrice"]=> string(4) "0.00" ["discountId"]=> string(1) "0" ["images"]=> array(3) { ["large"]=> string(75) "http://www.chinadatacase.com/files/course/2025/03-20/0941288cda3b927126.png" ["middle"]=> string(75) "http://www.chinadatacase.com/files/course/2025/03-20/0941288cea65854991.png" ["small"]=> string(75) "http://www.chinadatacase.com/files/course/2025/03-20/0941288cf10a074618.png" } ["ratingNum"]=> string(1) "0" ["rating"]=> string(1) "0" ["hitNum"]=> string(3) "235" ["hotSeq"]=> string(1) "0" ["maxPriceObj"]=> array(2) { ["currency"]=> string(3) "RMB" ["amount"]=> string(4) "0.00" } ["minPriceObj"]=> array(2) { ["currency"]=> string(3) "RMB" ["amount"]=> string(4) "0.00" } ["minDisplayPrice"]=> string(4) "0.00" ["maxDisplayPrice"]=> string(4) "0.00" ["minDisplayPriceObj"]=> array(2) { ["currency"]=> string(3) "RMB" ["amount"]=> string(4) "0.00" } ["maxDisplayPriceObj"]=> array(2) { ["currency"]=> string(3) "RMB" ["amount"]=> string(4) "0.00" } ["canManage"]=> bool(false) ["peopleShowNum"]=> string(3) "128" ["isMember"]=> bool(false) ["status"]=> string(7) "created" ["orgId"]=> string(1) "1" ["orgCode"]=> string(2) "1." ["recommendWeight"]=> string(1) "0" ["recommendedTime"]=> string(1) "0" ["createdTime"]=> string(25) "2025-01-13T16:59:56+08:00" ["updatedTime"]=> string(25) "2025-12-06T20:28:43+08:00" ["product"]=> array(7) { ["id"]=> string(4) "2061" ["targetType"]=> string(6) "course" ["title"]=> string(57) "“找的就是你”——文本分析与相似度计算" ["owner"]=> string(1) "3" ["createdTime"]=> string(10) "1736758796" ["updatedTime"]=> string(10) "1757482153" ["target"]=> array(17) { ["id"]=> string(4) "2182" ["type"]=> string(6) "normal" ["title"]=> string(57) "“找的就是你”——文本分析与相似度计算" ["subtitle"]=> string(0) "" ["summary"]=> string(1126) "

本实验案例来源于教学实践,基于Python实现学生实验报告实验结论的文本相似度计算,以计算结果为依据得到实验结论评分权重,以更好体现学生实践成果,杜绝抄袭现象。案例遵循CRISP-DM数据挖掘标准流程,以学生的实验报告数据为输入,使用Python完成各项实验环节,最终计算出实验报告的评分权重。案例数据源为当届学生的《Python语言程序设计》课程实验报告,首先通过docx库获取学生实验报告文档中的实验结论,完成数据收集,接着进行数据清洗和数据预处理,使用jieba包完成分词并进行词频统计,基于词频统计结果进行文本内容描述统计和可视化分析,接着抛出问题,引出TF-IDF词向量相关内容,再引导学生实现TF-IDF算法,并对比可视化结果,最后使用词向量生成学生实验结论的文本相似度矩阵,再基于相似度矩阵进行学生实验结论相似性的统计分析,引导学生采用合适的方式给出基于相对分数的学生实验报告相似度的评分权重。

" ["cover"]=> array(3) { ["large"]=> string(75) "http://www.chinadatacase.com/files/course/2025/03-20/0941288cda3b927126.png" ["middle"]=> string(75) "http://www.chinadatacase.com/files/course/2025/03-20/0941288cea65854991.png" ["small"]=> string(75) "http://www.chinadatacase.com/files/course/2025/03-20/0941288cf10a074618.png" } ["status"]=> string(9) "published" ["studentNum"]=> string(3) "128" ["discountType"]=> string(8) "discount" ["discount"]=> string(2) "10" ["minCoursePrice"]=> string(4) "0.00" ["maxCoursePrice"]=> string(4) "0.00" ["defaultCourseId"]=> string(4) "2188" ["productId"]=> string(4) "2061" ["goodsId"]=> string(4) "2060" ["minCoursePrice2"]=> array(2) { ["currency"]=> string(3) "RMB" ["amount"]=> string(4) "0.00" } ["maxCoursePrice2"]=> array(2) { ["currency"]=> string(3) "RMB" ["amount"]=> string(4) "0.00" } } } ["extensions"]=> array(3) { [0]=> string(8) "teachers" [1]=> string(14) "recommendGoods" [2]=> string(10) "isFavorite" } ["specs"]=> array(1) { [0]=> array(26) { ["id"]=> string(4) "2087" ["goodsId"]=> string(4) "2060" ["targetId"]=> string(4) "2188" ["title"]=> string(0) "" ["seq"]=> string(1) "1" ["status"]=> string(9) "published" ["price"]=> string(4) "0.00" ["coinPrice"]=> string(4) "0.00" ["usageMode"]=> string(7) "forever" ["usageDays"]=> string(1) "0" ["usageStartTime"]=> string(1) "0" ["usageEndTime"]=> string(1) "0" ["buyableStartTime"]=> string(1) "0" ["buyableEndTime"]=> string(1) "0" ["buyableMode"]=> NULL ["buyable"]=> string(1) "1" ["maxJoinNum"]=> string(1) "0" ["services"]=> array(0) { } ["priceObj"]=> array(2) { ["currency"]=> string(3) "RMB" ["amount"]=> string(4) "0.00" } ["displayPrice"]=> string(4) "0.00" ["displayPriceObj"]=> array(2) { ["currency"]=> string(3) "RMB" ["amount"]=> string(4) "0.00" } ["isMember"]=> bool(false) ["access"]=> array(2) { ["code"]=> string(14) "user.not_login" ["msg"]=> string(15) "用户未登录" } ["hasCertificate"]=> bool(false) ["learnUrl"]=> string(43) "http://www.chinadatacase.com/my/course/2188" ["teachers"]=> array(1) { [0]=> array(6) { ["id"]=> string(1) "3" ["nickname"]=> string(5) "admin" ["title"]=> string(1) " " ["uuid"]=> string(40) "634d3b58166bfafd4069119be97ee6bfee064c52" ["destroyed"]=> string(1) "0" ["avatar"]=> array(3) { ["small"]=> string(75) "http://www.chinadatacase.com/files/user/otherform/1711697442_1722994936.png" ["middle"]=> string(75) "http://www.chinadatacase.com/files/user/otherform/1711697442_1722994936.png" ["large"]=> string(75) "http://www.chinadatacase.com/files/user/otherform/1711697442_1722994936.png" } } } } } } “找的就是你”——文本分析与相似度计算 - 中国经管实验教学案例平台