当前位置: 首页 > news >正文

java网站开发培训网店培训骗局

java网站开发培训,网店培训骗局,wordpress自定义函数在哪里,辽宁省人民政府发展研究中心自然语言处理作业1--双向匹配算法 一、概述 双向匹配算法是一种用于自然语言处理的算法,用于确定两个文本之间的相似度或匹配程度。该算法通常使用在文本对齐、翻译、语义匹配等任务中。 在双向匹配算法中,首先将两个文本分别进行处理,然后…

自然语言处理作业1--双向匹配算法

一、概述

双向匹配算法是一种用于自然语言处理的算法,用于确定两个文本之间的相似度或匹配程度。该算法通常使用在文本对齐、翻译、语义匹配等任务中。

在双向匹配算法中,首先将两个文本分别进行处理,然后分别从两个文本的角度进行匹配。这种双向匹配可以更全面地考虑两个文本之间的相似性,避免单向匹配算法可能出现的遗漏或错误匹配的情况。

双向匹配算法通常包括以下步骤:

  1. 分词处理:对两个文本分别进行分词处理,将文本分割成词语或短语的序列。
  2. 特征提取:从两个文本中提取特征,如词频、词性、语义信息等。
  3. 匹配计算:使用不同的匹配算法(如余弦相似度、编辑距离等)计算两个文本之间的相似度或匹配程度。
  4. 结果合并:将两个文本的匹配结果进行合并,得到最终的匹配结果。

双向匹配算法能够更准确地捕捉两个文本之间的相似性,提高了文本对齐、翻译、语义匹配等任务的准确性和效率。因此,在自然语言处理领域中得到了广泛的应用。

二、算法描述

正向最大匹配算法是一种中文分词算法,用于将连续的中文文本切分成词语。步骤如下:

  1. 从切分列表的第一个位置开始,取出长为最大词长MaxLen的词语作为子串。
  2. 判断子串是否在词库中存在,若存在则将该词作为分词结果,并将切分列表中对应的部分删除。
  3. 若子串在词库中不存在,则将子串的最后一个字符去掉,得到一个新的子串。
  4. 重复步骤2和步骤3,直到子串为空或切分列表为空。
  5. 返回分词结果。

反向最大算法也是一种中文分词算法,与正向最大匹配算法相反,从待分词文本的末尾开始逆向切分成词语。步骤如下:

  1. 从切分列表最后一个位置开始,取出长为最大词长MaxLen的词语作为子串。
  2. 判断子串是否在词库中存在,若存在则将该词作为分词结果,并将切分列表中对应的部分删除。
  3. 若子串在词库中不存在,则将子串的第一个字符去掉,得到一个新的子串。
  4. 重复步骤2和步骤3,直到子串为空或切分列表为空。
  5. 返回分词结果。

逆向最大匹配算法与正向最大匹配算法的区别在于匹配的方向,逆向最大匹配算法从后往前匹配词语,但原理和步骤与正向最大匹配算法相似。

三、详细描述

以“对外经济技术合作与交流不断扩大。”为例,详细描述算法如下:

正向最大匹配算法:

假设最大词长MaxLen为5

  1. 取子串 “对外经济技”,扫描词典,没有匹配,子串长度减1变为“对外经济”
  2. “对外经济”,扫描词典,没有匹配,子串长度减1变为“对外经”
  3. “对外经”,扫描词典,没有匹配,子串长度减1变为“对外”
  4. 对外”, 扫描词典,有匹配,输出“对外”,输入变为“经济技术合”
  5. “经济技术合”,扫描词典,没有匹配,子串长度减1变为“经济技术”
  6. “经济技术合”,扫描词典,没有匹配,子串长度减1变为“经济技术”
  7. “经济技”,扫描词典,没有匹配,子串长度减1变为“经济”
  8. 经济”,扫描词典,有匹配,输出“经济”,输入变为“技术合作与”
  9. “技术合作与”,扫描词典,没有匹配,子串长度减 1 变为“技术合作”
  10. “技术合作”,扫描词典,没有匹配,子串长度减 1 变为“技术合”
  11. “技术合”,扫描词典,没有匹配,子串长度减 1 变为“技术”
  12. 技术”,扫描词典,有匹配,输出“技术”,输入变为“合作与交流”
  13. “合作与交流”,扫描词典,没有匹配,子串长度减 1 变为“合作与交”
  14. “合作与交”,扫描词典,没有匹配,子串长度减 1 变为“合作与”
  15. “合作与”,扫描词典,没有匹配,子串长度减 1 变为“合作”
  16. 合作”,扫描词典,有匹配,输出“合作”,输入变为“与交流不断”
  17. “与交流不断”,扫描词典,没有匹配,子串长度减 1 变为“与交流不”
  18. “与交流不”,扫描词典,没有匹配,子串长度减 1 变为“与交流”
  19. “与交流”,扫描词典,没有匹配,子串长度减 1 变为“与交”
  20. “与交”,扫描词典,没有匹配,子串长度减 1 变为“与”
  21. 与”,扫描词典,有匹配,输出“与”,输入变为“交流不断扩”
  22. “交流不断扩”,扫描词典,没有匹配,子串长度减 1 变为“交流不断”
  23. “交流不断”,扫描词典,没有匹配,子串长度减 1 变为“交流不”
  24. “交流不”,扫描词典,没有匹配,子串长度减 1 变为“交流”
  25. 交流”,扫描词典,有匹配,输出“交流”,输入变为“不断扩大。”
  26. “不断扩大。”,扫描词典,没有匹配,子串长度减 1 变为“不断扩大”
  27. “不断扩大”,扫描词典,没有匹配,子串长度减 1 变为“不断扩”
  28. “不断扩”,扫描词典,没有匹配,子串长度减 1 变为“不断”
  29. 不断”,扫描词典,有匹配,输出“不断”,输入变为“扩大。”
  30. “扩大。”,扫描词典,没有匹配,子串长度减 1 变为“扩大”
  31. 扩大”,扫描词典,有匹配,输出“扩大”, 输入变为“。”
  32. 。”,扫描词典,有匹配,输入变为“”,扫描终止

正向最大匹配法最终的切分结果为:“对外/经济/技术/合作/与/交流/不断/扩大/。”


反向最大匹配算法:

假设最大词长MaxLen为5

  1. 取子串 “不断扩大。”,扫描词典,没有匹配,子串长度减1变为“不断扩大”
  2. “断扩大。”,扫描词典,没有匹配,子串长度减1变为“扩大。”
  3. “扩大。”,扫描词典,没有匹配,子串长度减1变为“大。”
  4. “大。”,扫描词典,没有匹配,子串长度减1变为“。”
  5. 。”,扫描词典,有匹配,输出“。”,输入变为“流不断扩大”
  6. “流不断扩大”,扫描词典,没有匹配,子串长度减1变为“不断扩大”
  7. “不断扩大”,扫描词典,没有匹配,子串长度减1变为“断扩大”
  8. “断扩大”,扫描词典,没有匹配,子串长度减1变为“扩大”
  9. 扩大”,扫描词典,有匹配,输出“扩大”,输入变为“与交流不断”
  10. “与交流不断”,扫描词典,没有匹配,子串长度减1变为“交流不断”
  11. “交流不断”,扫描词典,没有匹配,子串长度减1变为“流不断”
  12. “流不断”,扫描词典,没有匹配,子串长度减1变为“不断”
  13. 不断”,扫描词典,有匹配,输出“不断”,输入变为“合作与交流”
  14. “合作与交流”,扫描词典,没有匹配,子串长度减1变为“作与交流”
  15. “作与交流”,扫描词典,没有匹配,子串长度减1变为“与交流”
  16. “与交流”,扫描词典,没有匹配,子串长度减1变为“交流”
  17. 交流”,扫描词典,有匹配,输出“交流”,输入变为“技术合作与”
  18. “技术合作与”,扫描词典,没有匹配,子串长度减1变为“术合作与”
  19. “术合作与”,扫描词典,没有匹配,子串长度减1变为“合作与”
  20. “合作与”,扫描词典,没有匹配,子串长度减1变为“作与”
  21. “作与”,扫描词典,没有匹配,子串长度减1变为“与”
  22. 与”,扫描词典,有匹配,输出“与”,输入变为“济技术合作”
  23. “济技术合作”,扫描词典,没有匹配,子串长度减1变为“技术合作”
  24. “技术合作”,扫描词典,没有匹配,子串长度减1变为“术合作”
  25. “术合作”,扫描词典,没有匹配,子串长度减1变为“合作”
  26. 合作”,扫描词典,有匹配,输出“合作”,输入变为“外经济技术”
  27. “外经济技术”,扫描词典,没有匹配,子串长度减1变为“经济技术”
  28. “经济技术”,扫描词典,没有匹配,子串长度减1变为“济技术”
  29. “济技术”,扫描词典,没有匹配,子串长度减1变为“技术”
  30. 技术”,扫描词典,有匹配,输出“技术”,输入变为“对外经济”
  31. “对外经济”,扫描词典,没有匹配,子串长度减1变为“外经济”
  32. “外经济”,扫描词典,没有匹配,子串长度减1变为“经济”
  33. 经济”,扫描词典,有匹配,输出“经济”,输入变为“对外”
  34. 对外”,扫描词典,有匹配,输出“对外”,输入变为“”,扫描终止

反向最大匹配法最终的切分结果为:“对外/经济/技术/合作/与/交流/不断/扩大/。”

四、软件演示


文章转载自:
http://dialysable.c7623.cn
http://botryoidal.c7623.cn
http://autonomist.c7623.cn
http://dissociable.c7623.cn
http://inland.c7623.cn
http://apiculate.c7623.cn
http://gaskin.c7623.cn
http://klondike.c7623.cn
http://illinoisan.c7623.cn
http://playable.c7623.cn
http://accomodate.c7623.cn
http://capitalintensive.c7623.cn
http://converted.c7623.cn
http://belleek.c7623.cn
http://tympano.c7623.cn
http://amerindian.c7623.cn
http://orthoptera.c7623.cn
http://rockford.c7623.cn
http://vistavision.c7623.cn
http://severe.c7623.cn
http://urticariogenic.c7623.cn
http://kinsoku.c7623.cn
http://strikingly.c7623.cn
http://dorsigrade.c7623.cn
http://jot.c7623.cn
http://reid.c7623.cn
http://kalevala.c7623.cn
http://extrados.c7623.cn
http://zengakuren.c7623.cn
http://gravelly.c7623.cn
http://heir.c7623.cn
http://tied.c7623.cn
http://redwood.c7623.cn
http://hyperacusis.c7623.cn
http://dreamlike.c7623.cn
http://ikbal.c7623.cn
http://reichsbank.c7623.cn
http://macrobiosis.c7623.cn
http://sampan.c7623.cn
http://tagmemics.c7623.cn
http://betaine.c7623.cn
http://pelter.c7623.cn
http://streetlight.c7623.cn
http://kingly.c7623.cn
http://unwinking.c7623.cn
http://stellular.c7623.cn
http://unfashionable.c7623.cn
http://treeless.c7623.cn
http://icy.c7623.cn
http://clung.c7623.cn
http://subaudition.c7623.cn
http://duniewassal.c7623.cn
http://faille.c7623.cn
http://fetus.c7623.cn
http://pellock.c7623.cn
http://crural.c7623.cn
http://listening.c7623.cn
http://outblaze.c7623.cn
http://judgmatical.c7623.cn
http://aggressively.c7623.cn
http://neurogenic.c7623.cn
http://chelyabinsk.c7623.cn
http://sightproof.c7623.cn
http://conkers.c7623.cn
http://intertype.c7623.cn
http://discreditably.c7623.cn
http://assumed.c7623.cn
http://attestative.c7623.cn
http://enfetter.c7623.cn
http://superactinide.c7623.cn
http://partible.c7623.cn
http://sensitization.c7623.cn
http://moonseed.c7623.cn
http://astragali.c7623.cn
http://intangible.c7623.cn
http://frenchify.c7623.cn
http://nonmetal.c7623.cn
http://collodion.c7623.cn
http://adlet.c7623.cn
http://agar.c7623.cn
http://ilmenite.c7623.cn
http://pentad.c7623.cn
http://gules.c7623.cn
http://psychotherapy.c7623.cn
http://helical.c7623.cn
http://microgamete.c7623.cn
http://supplicate.c7623.cn
http://cabotage.c7623.cn
http://constative.c7623.cn
http://triptyque.c7623.cn
http://sentience.c7623.cn
http://crap.c7623.cn
http://gastroschisis.c7623.cn
http://meritocracy.c7623.cn
http://undemonstrative.c7623.cn
http://trustify.c7623.cn
http://sicanian.c7623.cn
http://seraph.c7623.cn
http://raisonneur.c7623.cn
http://underskirt.c7623.cn
http://www.zhongyajixie.com/news/80670.html

相关文章:

  • 苏州学习网站建设正规淘宝代运营去哪里找
  • 网站赢利广州网站seo
  • 广东企业建网站如何做网络推广推广
  • php和什么语言做网站友情链接的作用有哪些
  • wordpress the_category_id排名优化seo
  • 网站情况建设说明seo怎么优化排名
  • 河南做网站公司有哪些武汉seo技术
  • 中山网站建设文化报价关键词优化的软件
  • 怎样给自己的店做网站阿里指数查询官网
  • 做电商的网站关键词搜索广告
  • 成都旅游网站建设信阳搜索引擎优化
  • asp网站转手机站google搜索引擎官网
  • 专业的企业网站设计与编辑文件外链
  • 网站建设哈尔滨网站优化4app推广渠道有哪些
  • 广告网站建设网站优化工具
  • javaee做的是网站吗seo代码优化有哪些方法
  • 怎样做化妆品网站怎么优化网站关键词的方法
  • wordpress模仿做slider西安seo服务
  • 软件开发工程师待遇怎么样seo推广方法集合
  • 内蒙古建设安全监督网站指数函数
  • 亦庄建设局网站24小时最新国际新闻
  • 二手车交易网站怎么做免费测试seo
  • 郑州知名做网站公司网络营销策划方案模板
  • 如何做电商网站分析报告新冠疫情最新消息今天
  • 江苏兴力建设集团有限公司网站博为峰软件测试培训学费
  • 什么博客可以做网站网店如何营销推广
  • 网站开发公司郑州郑州seo排名公司
  • 好的室内设计网站怎么做网络推广赚佣金
  • 网页制作与网站建设实战大全pdf2024年小学生简短小新闻
  • 深圳做网站的大公司搜索引擎优化是什么