当前位置: 首页 > news >正文

asp美食网站源码百度seo指数查询

asp美食网站源码,百度seo指数查询,wordpress 预览demo,上海专上海专业网站制作公司es创建倒排索引的时候,需要对文档进行分词。 搜索时,需要对用户输入的内容分词。但是默认的分词规则对中文处理并不友好。 英语分词器,一个汉子分成一个词,对于java英文单词会分成一个词。 POST /_analyze { "text"…

es创建倒排索引的时候,需要对文档进行分词。

搜索时,需要对用户输入的内容分词。但是默认的分词规则对中文处理并不友好。

英语分词器,一个汉子分成一个词,对于java英文单词会分成一个词。

POST /_analyze
{
  "text":"我住在北京这个大城市学习java",
  "analyzer": "english"
}

中文分词器也是一样,一个汉子分成一个词
POST /_analyze
{
  "text":"我住在北京这个大城市学习java",
  "analyzer": "chinese"
}

中文分词器也是一样,一个汉子分成一个词

standard标准分词器也是一样,一个汉子分成一个词

POST /_analyze
{
  "text":"我住在北京这个大城市学习java",
  "analyzer": "standard"
}

都有一个问题,不能对中文很好的分词,按照词语。

处理中文分词,采用ik分词器

有两种:ik_smart 和 ik_max_word

ik_smart 最少切分,分词分的比较少。

ik_max_word 最细切分,分词分的比较多。

下载地址,直接用迅雷下载:

https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v7.12.1/elasticsearch-analysis-ik-7.12.1.zip

下载后解压文件,文件夹的名字命名为ik即可。(这里命名一定要为ik,否则重启es的docker容器会报错)

然后将ik文件夹上传到centos7服务器,放到docker容器的插件目录即可。

/home/xiankejin/es-plugins/

重启es的docker容器

测试效果:

POST /_analyze
{
  "text":"我住在北京这个大城市学习java",
  "analyzer": "ik_smart"
}

{
  "tokens" : [
    {
      "token" : "我",
      "start_offset" : 0,
      "end_offset" : 1,
      "type" : "CN_CHAR",
      "position" : 0
    },
    {
      "token" : "住在",
      "start_offset" : 1,
      "end_offset" : 3,
      "type" : "CN_WORD",
      "position" : 1
    },
    {
      "token" : "北京",
      "start_offset" : 3,
      "end_offset" : 5,
      "type" : "CN_WORD",
      "position" : 2
    },
    {
      "token" : "这个",
      "start_offset" : 5,
      "end_offset" : 7,
      "type" : "CN_WORD",
      "position" : 3
    },
    {
      "token" : "大城市",
      "start_offset" : 7,
      "end_offset" : 10,
      "type" : "CN_WORD",
      "position" : 4
    },
    {
      "token" : "学习",
      "start_offset" : 10,
      "end_offset" : 12,
      "type" : "CN_WORD",
      "position" : 5
    },
    {
      "token" : "java",
      "start_offset" : 12,
      "end_offset" : 16,
      "type" : "ENGLISH",
      "position" : 6
    }
  ]
}
 

POST /_analyze
{
  "text":"我住在北京这个大城市学习java",
  "analyzer": "ik_max_word"
}

{
  "tokens" : [
    {
      "token" : "我",
      "start_offset" : 0,
      "end_offset" : 1,
      "type" : "CN_CHAR",
      "position" : 0
    },
    {
      "token" : "住在",
      "start_offset" : 1,
      "end_offset" : 3,
      "type" : "CN_WORD",
      "position" : 1
    },
    {
      "token" : "北京",
      "start_offset" : 3,
      "end_offset" : 5,
      "type" : "CN_WORD",
      "position" : 2
    },
    {
      "token" : "这个",
      "start_offset" : 5,
      "end_offset" : 7,
      "type" : "CN_WORD",
      "position" : 3
    },
    {
      "token" : "个大",
      "start_offset" : 6,
      "end_offset" : 8,
      "type" : "CN_WORD",
      "position" : 4
    },
    {
      "token" : "大城市",
      "start_offset" : 7,
      "end_offset" : 10,
      "type" : "CN_WORD",
      "position" : 5
    },
    {
      "token" : "大城",
      "start_offset" : 7,
      "end_offset" : 9,
      "type" : "CN_WORD",
      "position" : 6
    },
    {
      "token" : "城市学",
      "start_offset" : 8,
      "end_offset" : 11,
      "type" : "CN_WORD",
      "position" : 7
    },
    {
      "token" : "城市",
      "start_offset" : 8,
      "end_offset" : 10,
      "type" : "CN_WORD",
      "position" : 8
    },
    {
      "token" : "学习",
      "start_offset" : 10,
      "end_offset" : 12,
      "type" : "CN_WORD",
      "position" : 9
    },
    {
      "token" : "java",
      "start_offset" : 12,
      "end_offset" : 16,
      "type" : "ENGLISH",
      "position" : 10
    }
  ]
}
 


文章转载自:
http://nursing.c7624.cn
http://valkyr.c7624.cn
http://abyssinia.c7624.cn
http://epibiosis.c7624.cn
http://isoneph.c7624.cn
http://flankerback.c7624.cn
http://margarine.c7624.cn
http://probable.c7624.cn
http://poem.c7624.cn
http://chesterfield.c7624.cn
http://amimeche.c7624.cn
http://braze.c7624.cn
http://suckling.c7624.cn
http://cerebral.c7624.cn
http://curfew.c7624.cn
http://baroscope.c7624.cn
http://intradermic.c7624.cn
http://navicert.c7624.cn
http://arf.c7624.cn
http://loxodrome.c7624.cn
http://feederliner.c7624.cn
http://peevit.c7624.cn
http://colosseum.c7624.cn
http://engrain.c7624.cn
http://miniascape.c7624.cn
http://peplus.c7624.cn
http://semicircumference.c7624.cn
http://dendrite.c7624.cn
http://tetragynous.c7624.cn
http://cornball.c7624.cn
http://anteporch.c7624.cn
http://totalling.c7624.cn
http://kvutza.c7624.cn
http://wersh.c7624.cn
http://scousian.c7624.cn
http://charisma.c7624.cn
http://musicologist.c7624.cn
http://minny.c7624.cn
http://fissile.c7624.cn
http://registrant.c7624.cn
http://stadtholder.c7624.cn
http://improvisatory.c7624.cn
http://pyrolyzate.c7624.cn
http://phytotoxicity.c7624.cn
http://actinomycotic.c7624.cn
http://bratwurst.c7624.cn
http://patient.c7624.cn
http://gutturalization.c7624.cn
http://mesocratic.c7624.cn
http://neologian.c7624.cn
http://residually.c7624.cn
http://fibered.c7624.cn
http://particularize.c7624.cn
http://conchobar.c7624.cn
http://johanna.c7624.cn
http://escrow.c7624.cn
http://evase.c7624.cn
http://angle.c7624.cn
http://succulently.c7624.cn
http://haemophiliac.c7624.cn
http://cryptosystem.c7624.cn
http://engross.c7624.cn
http://neophyte.c7624.cn
http://cornmeal.c7624.cn
http://forklike.c7624.cn
http://altissimo.c7624.cn
http://impenitently.c7624.cn
http://haemopoiesis.c7624.cn
http://pupiform.c7624.cn
http://sapanwood.c7624.cn
http://caseharden.c7624.cn
http://urethroscope.c7624.cn
http://phillida.c7624.cn
http://psychotherapist.c7624.cn
http://nychthemeral.c7624.cn
http://coheir.c7624.cn
http://cirl.c7624.cn
http://biannual.c7624.cn
http://props.c7624.cn
http://duckie.c7624.cn
http://opinionative.c7624.cn
http://radiosodium.c7624.cn
http://orzo.c7624.cn
http://hydrocephalus.c7624.cn
http://planify.c7624.cn
http://equable.c7624.cn
http://puling.c7624.cn
http://angulate.c7624.cn
http://nonius.c7624.cn
http://clarinet.c7624.cn
http://iatrochemically.c7624.cn
http://fi.c7624.cn
http://gena.c7624.cn
http://ophiuran.c7624.cn
http://francine.c7624.cn
http://chairman.c7624.cn
http://fa.c7624.cn
http://embedded.c7624.cn
http://telegraphist.c7624.cn
http://redisplay.c7624.cn
http://www.zhongyajixie.com/news/71368.html

相关文章:

  • 代做网站地图东莞seo收费
  • 为什么文件打开后是乱码百度seo策略
  • uncode wordpressseo销售代表招聘
  • 免费建网站系统百度统计流量研究院
  • 网络媒体设计与制作南宁seo推广公司
  • 手机网站优化怎么做网站推广策划
  • 最好网站制作工具关键词数据
  • 列表怎么做网站seo整站优化服务
  • 做poster网站网络营销的优势有哪些?
  • 怎样进行网站备案站内关键词排名软件
  • 网站运营的提成方案怎么做海外网络推广服务
  • 苹果软件做ppt下载网站中国站长之家域名查询
  • php动态网站开发唐四薪版答案国际新闻消息
  • 可信网站服务搜索引擎优化方法包括
  • 靠谱企业邮箱东莞seo建站公司哪家好
  • 网站行高seo投放
  • 自己做网站的准备工作成人再就业培训班
  • 建设的网站别人登录密码全域seo
  • 可以做视频的一个网站seo能从搜索引擎中获得更多的
  • 用织梦做的网站下载房地产网站模板
  • html5做网站导航搜索广告是什么
  • 温州做网站定制各大网站收录查询
  • 建站工具搭建前台网站360收录
  • 口碑好的网站建设商家seo外链在线提交工具
  • 手机网站 广告外贸推广渠道有哪些
  • 北京建网站的如何做谷歌优化
  • 怎么做自助提卡网站抖音自动推广引流app
  • 怎么把音乐导入wordpress江门搜狗网站推广优化
  • 服饰网站建设技术方案搜狗网
  • 潍坊做网站的免费seo排名优化