365文库
登录
注册
2

项目八:旅游电子商务数据挖掘 教案(表格式)- 《旅游电子商务(第2版)》同步教学(人民大学版).doc

152阅读 | 5收藏 | 8页 | 打印 | 举报 | 认领 | 下载提示 | 分享:
2
项目八:旅游电子商务数据挖掘 教案(表格式)- 《旅游电子商务(第2版)》同步教学(人民大学版).doc第1页
项目八:旅游电子商务数据挖掘 教案(表格式)- 《旅游电子商务(第2版)》同步教学(人民大学版).doc第2页
项目八:旅游电子商务数据挖掘 教案(表格式)- 《旅游电子商务(第2版)》同步教学(人民大学版).doc第3页
项目八:旅游电子商务数据挖掘 教案(表格式)- 《旅游电子商务(第2版)》同步教学(人民大学版).doc第4页
项目八:旅游电子商务数据挖掘 教案(表格式)- 《旅游电子商务(第2版)》同步教学(人民大学版).doc第5页
项目八:旅游电子商务数据挖掘 教案(表格式)- 《旅游电子商务(第2版)》同步教学(人民大学版).doc第6页
项目八:旅游电子商务数据挖掘 教案(表格式)- 《旅游电子商务(第2版)》同步教学(人民大学版).doc第7页
项目八:旅游电子商务数据挖掘 教案(表格式)- 《旅游电子商务(第2版)》同步教学(人民大学版).doc第8页
福利来袭,限时免费在线编辑
转Pdf
right
1/8
right
下载我编辑的
下载原始文档
收藏 收藏
搜索
下载二维码
App功能展示
海量免费资源 海量免费资源
文档在线修改 文档在线修改
图片转文字 图片转文字
限时免广告 限时免广告
多端同步存储 多端同步存储
格式轻松转换 格式轻松转换
用户头像
独自苦笑 上传于:2024-08-20
项目八旅游数据挖掘教案章节模块项目八内容旅游数据挖掘教学目的与要求知识目标理解数据挖掘的概念和内涵理解机器学习数据挖掘之间的区别和联系理解旅游数据挖掘的意义技能目标能够运用语言从旅游网站上提取有用信息并保存至本地存储能够对中文文本进行文本分析提取关键词分析词频能够运用情感分析技术对游客对景区的网络点评进行舆情分析态度目标提升学生对旅游数据挖掘工作的理解和职业热爱培养学生的创意创新思维和团队协作精神培养学生认真细致的工作态度和工匠精神通过中文分词的学习让学生感悟汉字与中文之美坚定文化自信教学重点难点重点内容理解和掌握数据挖掘机器学习等概念掌握使用语言和相关软件包进行简单的数据挖掘实验难点内容能够使用语言进行简单的程序设计编写网络提取信息的程序应用软件包进行简单的数据挖掘实验教学方法投影仪讲授上机教学手段多媒体教学互动教学演示教学教学内教学环节教学程序导入新课近年来大数据和数据挖掘的概念频繁出现在各类媒体上曝光率和回头率都非常高在旅游业中也不例外请扫一扫二维码阅读第一财经的这篇报道你有没有看懂旅游大数据以人为一个小组查阅大数据与数据挖掘在旅游业应用的案例分组讨论什么是数据挖掘数据挖掘在电子商务业务上有哪些成功的案例旅游业是否也需要进行旅游数据挖掘容及其过程教学内容及其过程学习新课任务一旅游数据挖掘基础知识数据挖掘对数据挖掘的定义是数据挖掘是一项分析大量数据以发现有意义的模式和规则的业务流程数据挖掘的目标是从数据库中发现隐含的有意义的知识林杰斌刘明德等学者在数据挖掘与理论与实务一书中认为数据挖掘主要有以下五类功能自动预测趋势和行为关联分析聚类概念描述偏差检测一般数据挖掘技术包括关联分析序列分析分类预测聚类分析及时间序列分析机器学习是一门多领域交叉学科涉及概率论统计学逼近论凸分析算法复杂度理论等多门学科数据挖掘是从海量数据中获取有效的新颖的潜在有用的最终可理解的模式的非平凡过程数据挖掘中用到了大量的机器学习界提供的数据分析技术和数据库界提供的数据管理技术在年出版的一书中指出从数据分析的角度来看数据挖掘与机器学习有很多相似之处但不同之处也十分明显例如数据挖掘并没有机器学习中所包含的探索人的学习机制这一科学发现任务数据挖掘中的数据分析是针对海量数据进行的等等从某种意义上说机器学习的科学成分更重一些而数据挖掘的技术成分更重一些任务二电商数据挖掘工具一常见数据挖掘工具数据挖掘工具是使用数据挖掘技术从大型数据集中发现并识别模式的计算机软件数据在当今世界中就意味着金钱但是因为大多数数据都是非结构化的因此拥有数据挖掘工具将成为帮助您获得正确数据的一种方法下面为大家介绍款常用的数据挖掘工具二语言使用一简介二的基本用法安装与配置语法简介任务三电商数据挖掘的方法一情感分析技术情感分析技术简介情感分析通常是指对一段带有主观性情感的文本进行分析的过程情感分析有很强的实用价值例如通过对某酒店服务评论的情感分析可以发现顾客对该酒店软硬件设施和服务的褒贬态度和意见从而改进设施并改善服务赢得竞争优势通过对游客对某条旅游线路的评论情感分析旅行社可以了解游客对该线路的态度倾向分布从而优化路线提高服务品质从竞争中脱颖而出通过情感分析技术可以帮助企业从互联网上海量的产品评论中获取对产品综合全面的评价信息因此许多企业都对应用情感分析技术分析客人的网络评价有着迫切的需要因此如何从旅游网络评价中获取游客的情感倾向并更好的服务于游客是一个非常有实用价值的研究方向目前进行情感分析主要使用两种方法分别是基于机器学习的方法和基于语义的方法基于机器学习的方法是利用分类技术来处理文本分类技术一般是使用某种学习算法来确定分类模型该模型不但很好地拟合输入数据中的类标号与属性集之间的关系还能够正确地预测未知样本的类标号中类标号我们需要为它提供一个人工标注的训练集通过上述的学习算法训练并建立分类模型然后可以将这个模型运用于检验集从而检验类标号未知情感文本记录基于语义的方法一般是先获得情感倾向词把表示情感的词语划分成正面词语和负面词语同时构造一个专用的情感词典然后利用这个词典使用线性代数和统计分析的方法来统计文本中的正面和负面情感词语的相对数量从而确定文本的情感倾向二亲和性分析亲和性分析是根据样本个体之间的相似度确定它们关系的亲疏在数据挖掘中有大量的旅游营销的应用场景比如游客更愿意同时购买哪些景点的门票向景区网站用户提供多样化的服务或投放定向广告旅行社向游客推荐旅行线路卖给他们一些与之相关的产品亲和性有多种测量方法例如统计两个景点门票一起出售的频率或者统计游客购买了景点后再买景点的比率最常用的用来进行亲和性分析的两个重要概念是支持度和置信度任务四旅游数据挖掘应用景区游客点评词频分析以下代码可以提取去哪儿旅游网站的上游客对某一景点评价要抓取的页面链接去哪儿旅游网上有些景点网页无法直接用上面的办法提取评价信息需要使用进行解析以下代码可以实现这类网页评价信息的提取并保存到本地硬盘用户未点评系统默认好评已经成功的写入文件中文分词将游客对景区的评价信息从网页中提取出来以后需要对评论内容进行预处理第一步需要进行中文分词分词就是将连续的字序列按照一定的规范重新组合成词序列的过程我们知道在英文的行文中单词之间是以空格作为自然分界符的而中文只是字句和段能通过明显的分界符来简单划界唯独词没有一个形式上的分界符虽然英文也同样存在短语的划分问题不过在词这一层上中文比之英文要复杂得多困难得多中文分词就是将由汉字序列组成的评价语句通过一定的方法分割成若干个有着单独意义的汉语词条这一步比较关键同时这也是中文文本挖掘的重点和难点中文分词是文本挖掘的基础对于输入的一段中文成功的进行中文分词可以达到电脑自动识别语句含义的效果中文分词技术属于自然语言处理技术范畴对于一句话人可以通过自己的知识来明白哪些是词哪些不是词但如何让计算机也能理解其处理过程就是分词算法分词方法一般有种方法机械匹配的方法最大概率的方法语义理解的方法机械匹配的方法是最常用的方法在借助一个词典的帮助下它主要利用正向或者反向最大匹配的原则来分词清华大学系统就是这种方法实现的最大概率是根据一个事先建立的常用词语的概率表依据这张概率表对汉字字符串可能存在的多种分词结果进行统计分析将其中概率最大的那个结果作为该汉字字符串的分词结果代表系统有中科院计算所系统基于语义理解的方法这种方法可以实现新词识别功能亦称为人工智能分词方法山西大学系统是其代表中文分词支持三种分词模式精确模式试图将句子最精确地切开适合文本分析全模式把句子中所有的可以成词的词语都扫描处理速度非常快但是不能解决歧义搜索引擎模式在精确模式的基础上对长词再次切分提高召回率适合用于引擎分词另外还支持繁体分词和支持自定义词典以下代码实现了一段景区点评的中文分词扬州瘦西湖一直是闻其名果然是美景怡人门票稍贵了点不过也算值得在湖上荡舟别有风味就是四月的扬州人太多了些运行结果为扬州瘦西湖一直是闻其名果然是美景怡人门票稍贵了点不过也算值得在湖上荡舟别有风味就是四月的扬州人太多了些实训演练利用网页数据提取和文本情感分析技术对某景区景点旅客评价进行分析得出某种结论并把工作过程写成报告文字需要是正规书面用语结论需要有数据支持情感分析的结果需要得出正向评价的平均概率要有源代码需要对所使用的理论和技术进行介绍要符合一般论文的格式要求建议文章中要用相应的表格图片要注意报告的排版项目设计报告不少于字反馈练习见教材各任务的任务拓展练习及综合实训任务归纳总结课外作业与参考资料作业包含书面和口头作业去图书馆或检索互联网进一步查阅语言的编程技巧进一步学习网络信息提取的编程方法参考书目与资料著杜春晓译数据挖掘入门与实践中国工信出版集团等著张小明等译数据挖掘技术清华大学出版社卢辉数据挖掘与数据化运营实战思路方法技巧与应用机械工业出版社托马斯米勒著崔立真等译营销数据科学机械工业出版社王新宇基于情感词典与机器学习的旅游网络评价情感分析研究计算机与数字工程王新宇阮立新基于机器学习的旅游大数据分析研究中国旅游评论林杰斌刘明德陈湘数据挖掘与理论与实务清华大学出版社数据挖掘导论人民邮电出版社游浩鹏基于数据挖掘的舟山市旅游信息分析与预测浙江海洋大学王泽云刘子豪数据挖掘在旅游电子商务中的应用与研究中国管理信息化
tj