
浙教版2019高中信息技术必修第一册《4.2.3文本数据处理1》PPT课件.pptx
《浙教版2019高中信息技术必修第一册《4.2.3文本数据处理1》PPT课件.pptx》由会员分享,可在线阅读,更多相关《浙教版2019高中信息技术必修第一册《4.2.3文本数据处理1》PPT课件.pptx(24页珍藏版)》请在七彩学科网上搜索。
1、第四4.2.3文本数据处理文本数据处理章复习回顾感谢您使用我们的PPT模板,请在此输入您需要的文字内容请输入标题https:/ 情报分析情报分析 自动摘要、自动校对自动摘要、自动校对 论文查重、文本分类论文查重、文本分类 垃圾邮件过滤垃圾邮件过滤 机器翻译机器翻译 自动应答自动应答复习回顾感谢您使用我们的PPT模板,请在此输入您需要的文字内容请输入标题https:/ 中文文本可以采用字、词或短语作为表示文本的特征项。相比较而言词的切分难度小且更能表达文本含义。目前,大多数中文文本分析中都采用词作为特征项,这种词称作特征词。特征项特征提取方式 一般方式:根据专家的知识挑选有价值的特征用数学建模的
2、方法构造评估函数自动选取特征值文本数据分析与应用请输入标题标签云Acfun热词榜QQ个人标签文本数据分析与应用请输入标题观察下列标签云,他们有什么共同点?由词语组成文字有大小颜色丰富文本数据分析与应用请输入标题标签云定义:用词频表示文本特征,将关键词按照一定的顺序和规律排序,如频度递减、字母顺序等。并以文字大小的形式代表词语的重要性。应用:标签云广泛运用于报纸、杂志等传统媒体和互联网标签云是文本可视化的一种方式。文本数据分析与应用请输入标题文本情感分析最早之人工智能之父明斯基明斯基就提过“我们的问题不是怎样才能让机器智能有情感,而是机器智能怎么能没有情感。”人类有哪些情感?好,恶,乐,怒,哀,
3、惧,欲喜极而泣,抱头痛哭,捶胸顿足,七情六欲,五味杂陈文本数据分析与应用请输入标题文本情感分析粗粒度细粒度整篇文章语句级词语级词语级是在分词的基础上,根据情感词典进行特征提取和分类,再给特征词赋予权重进行统计分析。例如:满意+5,差-5文本数据分析与应用文本情感分析应用:网络舆情监控、用户评论分析和决策、信息预测等众多领域文本数据分析与应用文本数据处理的一般过程不包括()A.分词B.特征提取C.数据分析D.机器翻译D文本数据分析与应用以下哪项不是中文分词的一般方法()A.基于词典法B.基于统计法C.基于阿尔法D.基于规则法C文本数据分析与应用构造评估函数的特征提取法大多是基于()设计的A.语义分析B.情感分析C.概率统计D.专家知识C文本数据分析与应用 标签云主要是以()为文本特征 A.词频 B.词义 C.词句 D.词序A总结 1、文本数据处理的一般过程 2、中文分词的原理、方法、系统 3、文本特征提取的方法 4、文本数据分析与应用(标签云、文本情感分析)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 4.2.3文本数据处理1 浙教版 2019 高中 信息技术 必修 一册 4.2 文本 数据处理 PPT 课件
- 下载声明:
1. 本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领。
2. 所有PPT课件除打包和特殊嵌入外,均不含视频和音频,所看到的仅仅是链接图片;试卷类文档,如果标题没有明确说明有答案则都视为无答案,带答案试题资料的主观题可能无答案。请谨慎下单,否则不予退换。
3. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
4. 为防止被采集器采集,预览页只提供原文档前几页图片,并经过压缩处理,不会影响原文档质量,付款前后预览页数不变,请下载源文件查看完整内容。