当前位置: 首页 > news >正文

影视网站怎么做免费个人网站空间

影视网站怎么做,免费个人网站空间,重庆建设施工安全管理网,佛山市和城乡建设局网站ahocorasick.Automaton 是 Python 中 pyahocorasick 库提供的一个类,用于实现 Aho-Corasick 自动机。Aho-Corasick 算法是一种用于精确或近似多模式字符串搜索的高效算法。 通过 pip install pyahocorasick 安装 pyahocorasick 库。 并且,该模块是用 C 编…

ahocorasick.Automaton 是 Python 中 pyahocorasick 库提供的一个类,用于实现 Aho-Corasick 自动机。Aho-Corasick 算法是一种用于精确或近似多模式字符串搜索的高效算法。

通过 pip install pyahocorasick 安装 pyahocorasick 库。
并且,该模块是用 C 编写的,安装时需要有 C 编译器来编译本机 Cpython 扩展。

使用 ahocorasick.Automaton 类的一般步骤如下:

  1. 导入 ahocorasick 库:import ahocorasick

  2. 创建 Automaton 对象:a = ahocorasick.Automaton()

  3. (可选)将字符串键及其关联值添加到自动机,可作为 trie 树使用。例如:

    for idx, key in enumerate('heherhersshe'.split()):a.add_word(key, (idx, key))
    
  4. 调用 make_automaton() 方法完成并创建 Aho-Corasick 自动机:a.make_automaton()

创建好自动机后,可以使用以下主要方法进行搜索操作:

  • iter(string, (start, (end))):使用提供的输入字符串执行 Aho-Corasick 搜索过程。它返回一个迭代器,为在字符串中找到的键返回元组 (end_index, value),其中 end_index 是匹配结束的索引位置,value 是与匹配的键相关联的值。

  • iter_long(string, (start, (end))):返回一个搜索最长、非重叠匹配的迭代器(automaton_search_iter_long 类的对象)。

以下是一个使用 ahocorasick.Automaton 进行多模式字符串搜索的示例代码:

import ahocorasick as aha = ah.automaton()with open('userdict.txt', 'r', encoding='utf-8') as f2:  # 加载文件keywords = (a.strip() for a in f2.readlines())  # 加载关键词# 利用 add_word 方法将关键词加入自动机!for x in range(len(keywords)):a.add_word(keywords[x], (x, keywords[x]))  # 第二个参数为自定义的返回值# 创建 aho-corasick 自动机
a.make_automaton()with open('jianjie.txt', 'r', encoding='utf-8') as f:  # 打开要检索文档jianjie = f.read()  # 读取正文(如果太多,可以分断加载,分段检索)# 开始查找,该方法匹配最长的字符串
for item in a.iter_long(jianjie):print(item)
print('-' * 20)# 开始查找,该方法匹配所有字符串
for item in a.iter(jianjie):print(item)

在上述示例中,首先创建了一个自动机对象 a,然后从文件中读取关键词,并使用 add_word 方法将关键词添加到自动机中。接着调用 make_automaton 方法创建 Aho-Corasick 自动机。最后,通过打开另一个文件读取要搜索的正文,并使用 iter_longiter 方法进行匹配查找,并打印出匹配的结果。

Aho-Corasick 自动机的优点包括能够在一次运行中找到给定集合所有字符串,适用于多模式字符串匹配的场景,例如网络内容过滤、版权检测、病毒扫描等,在自然语言处理中查找特定词汇或模式,以及生物信息学中在 DNA 或蛋白质序列分析中寻找特定的序列模式等方面都有应用。

http://www.zhongyajixie.com/news/39540.html

相关文章:

  • 为什么建设网银网站打不开搜索引擎关键词排名优化
  • 易语言 wordpressseo标签怎么优化
  • 平面设计网上自学优化大师有必要安装吗
  • 网站建设目的分析软文写作的三个要素
  • icp 新闻网站外贸出口平台网站
  • 今日头条关键词排名优化十堰seo排名公司
  • 网站seo搜索引擎优化教程百度首页排名优化价格
  • 县区社保经办网站建设360官方网站网址
  • 一二三级域名有什么区别单页网站排名优化
  • 临沂国际外贸网站建设百度入口的链接
  • wordpress导入演示数据优化设计三年级上册答案语文
  • 移动网站建设流程青岛网络推广
  • 公司网站地图怎么做亚马逊关键词排名查询工具
  • 我自己的网站 怎样做防火墙深圳网络推广案例
  • 模板之家网站惠州seo按天计费
  • html5做网站系统河南郑州最新消息
  • 使用vue路由做网站聚名网
  • 销售网站建设的短文东营优化公司
  • 常见的有利于seo的网站系统seo怎么做
  • 注册公司网站怎么收费湖北百度推广公司
  • 个人网站怎么做收款链接营销推广方式都有哪些
  • 伊春住房和城乡建设网站青岛谷歌优化公司
  • 网站改版后seo该怎么做seo是什么职业
  • 做电子请帖的网站影视后期哪个培训靠谱
  • 美国网站建设中国免费域名注册平台
  • 金融公司网站建设东莞网站推广优化网站
  • 深圳汇网网站建设seo常用的优化工具
  • wordpress显示文章全文搜索引擎优化关键字
  • 公司网站实名认证怎么做怎样建立一个网站
  • 网站cms管理后台电话号码免费的网站关键词查询工具