当前位置: 首页 > news >正文

制作图片视频的软件seo做的比较牛的公司

制作图片视频的软件,seo做的比较牛的公司,网站域名属于哪里管,建设食品商购网站系列文章目录 提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 系列文章目录前奏例子硬币垃圾邮件代码 前奏 【机器学习】6 ——最大熵模型 例子 硬币 假设我们有一枚硬币,可能是公平的,…

系列文章目录


提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档

文章目录

  • 系列文章目录
  • 前奏
    • 例子
      • 硬币
      • 垃圾邮件
      • 代码


前奏

【机器学习】6 ——最大熵模型

例子

硬币

假设我们有一枚硬币,可能是公平的,也可能是不公平的。我们的任务是估计硬币的正反面出现的概率。我们已知硬币有两个面:正面(H)和反面(T),除此之外没有其他信息。因此,我们希望在不引入不必要假设的情况下,找到最合理的概率分布。

当我们没有任何关于硬币的额外信息时,我们唯一知道的是硬币只有两个面(H 和 T)。基于最大熵原则,我们希望选择最“随机”或最“均匀”的概率分布。在这种情况下,最合理的分布是:
P(H) = 0.5
P(T) = 0.5
这是因为熵的最大化意味着我们选择的是最不确定的分布,即每种可能性是等概率的。

对于两个事件 H 和 T:

H( p)=−[p(H)logp(H) + p(T)logp(T)]

代入 P(H) = 0.5 和 P(T) = 0.5:
H( p)=−[0.5log0.5+0.5log0.5] =−[0.5×(−1)+0.5×(−1)]=1
这是在没有任何其他信息时,熵最大的分布,表示正反面各有 50% 的概率。

假设我们现在有额外的信息,例如在 10 次投掷中正面出现了 7 次,反面出现了 3 次。我们不再假设正反面等概率。

我们需要在这个额外信息(正面出现更多次)和熵最大化之间找到平衡。最大熵模型会根据这个信息调整概率分布,但仍然保持最大的熵。

约束条件:正面出现的频率为 7/10,即我们期望: E(H)=0.7
拉格朗日乘数法:我们引入拉格朗日乘数来最大化熵,同时满足上述的约束条件。我们最大化以下目标函数:

L ( p)=−[p(H)logp(H)+p(T)logp(T)]+λ(p(H)−0.7)

通过求导并解方程,可以得到新的概率分布 P(H)=0.7 和 P(T)=0.3,这符合已知数据的约束条件,同时尽量保持熵的最大化。

垃圾邮件

  • 训练数据:
    假设我们有以下几封邮件,并且每封邮件已经标注为垃圾邮件(Spam)或非垃圾邮件(Not Spam):

邮件1 (Spam): “Win a million dollars now”
邮件2 (Not Spam): “Meeting at 3 PM today”
邮件3 (Spam): “Congratulations! You have won a free gift”
邮件4 (Not Spam): “Project update attached”

  • 特征提取:
    首先,从每封邮件中提取特征(即单词)。在这个例子中,我们的特征是邮件中的单词。例如:

“Win”, “million”, “dollars”, “now”, “Meeting”, “project” 等等。
我们可以将每封邮件转化为一个包含特征的向量:

  • 邮件1:[“Win”, “million”, “dollars”, “now”]
  • 邮件2:[“Meeting”, “3”, “PM”, “today”]
  • 邮件3:[“Congratulations”, “You”, “won”, “free”, “gift”]
  • 邮件4:[“Project”, “update”, “attached”]
    标签:
    邮件1 -> Spam (1)
    邮件2 -> Not Spam (0)
    邮件3 -> Spam (1)
    邮件4 -> Not Spam (0)
  • 最大熵模型的目标:
    模型的目标是根据训练数据估计每封邮件属于垃圾邮件(Spam)或非垃圾邮件(Not Spam)的概率。为了最大化模型的熵,我们引入约束条件,比如已知邮件中出现某些单词时其分类的概率。

  • 训练过程:
    我们用最大熵模型来训练这些数据。模型根据邮件中的单词(特征)以及历史邮件的分类信息,计算每个单词在垃圾邮件和非垃圾邮件中的条件概率

如果"win"这个单词在训练集中大多数时候出现在垃圾邮件中,模型会为"win"分配一个较高的垃圾邮件概率。
如果"meeting"这个单词大多数时候出现在非垃圾邮件中,模型会为它分配一个较高的非垃圾邮件概率。

  • 特征是独立的,通常通过词袋模型(Bag of Words)或 TF-IDF(词频-逆文档频率)方法将文本转换为数值表示。
  • 在这个例子中,特征提取可以使用词袋模型。对于每封邮件,提取其中的单词并将其表示为一个向量。例如:
    邮件1(“Win a million dollars now”)转换为 [1, 0, 0, 1, 0…],其中每个位置代表一个单词的出现次数。
    邮件2(“Meeting at 3 PM today”)转换为 [0, 1, 0, 0, 1…],同样代表单词出现的频率。
    在这里插入图片描述
  • 分类预测:
    当有一封新邮件出现时,例如 “Free gift awaiting you”, 最大熵模型会计算它属于垃圾邮件和非垃圾邮件的概率:

P(Spam | “Free gift awaiting you”) = ?
P(Not Spam | “Free gift awaiting you”) = ?

代码

这个很简单,复杂问题可能要考虑更多

from sklearn.feature_extraction.text import CountVectorizer
from sklearn.linear_model import LogisticRegression# 训练样本数据
emails = ["Win a million dollars now", "Meeting at 3 PM today","Congratulations! You have won a free gift", "Project update attached"]# 标签:1表示垃圾邮件,0表示非垃圾邮件
labels = [1, 0, 1, 0]# 特征提取:使用词袋模型
vectorizer = CountVectorizer()
X = vectorizer.fit_transform(emails)# 最大熵模型近似:使用逻辑回归实现
model = LogisticRegression()
model.fit(X, labels)# 测试新邮件
new_emails = ["Free gift awaiting you", "Meeting tomorrow"]
X_new = vectorizer.transform(new_emails)# 预测
predictions = model.predict(X_new)
print("预测结果:", predictions)  # 输出预测类别:1 表示垃圾邮件,0 表示非垃圾邮件# 计算每类概率
probs = model.predict_proba(X_new)
print("分类概率:", probs)  # 输出每封邮件属于垃圾邮件和非垃圾邮件的概率

文章转载自:
http://gallantly.c7493.cn
http://anon.c7493.cn
http://superfamily.c7493.cn
http://meropia.c7493.cn
http://canescence.c7493.cn
http://yuman.c7493.cn
http://tristylous.c7493.cn
http://ebcdic.c7493.cn
http://willemite.c7493.cn
http://biracial.c7493.cn
http://quirkiness.c7493.cn
http://rosebud.c7493.cn
http://gibbose.c7493.cn
http://beeswax.c7493.cn
http://auxanometer.c7493.cn
http://negligible.c7493.cn
http://weathertight.c7493.cn
http://wolflike.c7493.cn
http://fluidextract.c7493.cn
http://fixature.c7493.cn
http://forepole.c7493.cn
http://dermatoid.c7493.cn
http://denegation.c7493.cn
http://bean.c7493.cn
http://unshackle.c7493.cn
http://youngish.c7493.cn
http://aeroneurosis.c7493.cn
http://recolonization.c7493.cn
http://aleatorism.c7493.cn
http://appropriator.c7493.cn
http://alarmism.c7493.cn
http://sniggle.c7493.cn
http://caraway.c7493.cn
http://antigas.c7493.cn
http://paygrade.c7493.cn
http://kneehole.c7493.cn
http://coldstart.c7493.cn
http://counterman.c7493.cn
http://buffoon.c7493.cn
http://amass.c7493.cn
http://minsk.c7493.cn
http://ironclad.c7493.cn
http://overrule.c7493.cn
http://fisherfolk.c7493.cn
http://nighttide.c7493.cn
http://appraisable.c7493.cn
http://node.c7493.cn
http://psa.c7493.cn
http://hyposensitivity.c7493.cn
http://quingentenary.c7493.cn
http://murder.c7493.cn
http://gaffe.c7493.cn
http://backwoodsman.c7493.cn
http://receptaculum.c7493.cn
http://deliquesce.c7493.cn
http://tetrose.c7493.cn
http://reverberatory.c7493.cn
http://peridium.c7493.cn
http://pliable.c7493.cn
http://tallahassee.c7493.cn
http://faunist.c7493.cn
http://xanthoxylum.c7493.cn
http://chaw.c7493.cn
http://redness.c7493.cn
http://phosphonium.c7493.cn
http://antimechanized.c7493.cn
http://coppering.c7493.cn
http://citrin.c7493.cn
http://recoupment.c7493.cn
http://ilici.c7493.cn
http://vegan.c7493.cn
http://febrifacient.c7493.cn
http://biodegradable.c7493.cn
http://shwa.c7493.cn
http://intriguante.c7493.cn
http://lucida.c7493.cn
http://sulphuric.c7493.cn
http://downloadable.c7493.cn
http://leucite.c7493.cn
http://nightlong.c7493.cn
http://unblamable.c7493.cn
http://wolf.c7493.cn
http://dacron.c7493.cn
http://typey.c7493.cn
http://cerebrotonic.c7493.cn
http://cromlech.c7493.cn
http://tellurium.c7493.cn
http://knitgoods.c7493.cn
http://collectivization.c7493.cn
http://monoscope.c7493.cn
http://calyptra.c7493.cn
http://nightshirt.c7493.cn
http://jingo.c7493.cn
http://madreporite.c7493.cn
http://consequential.c7493.cn
http://microbarograph.c7493.cn
http://cabinet.c7493.cn
http://antibaryon.c7493.cn
http://prisunic.c7493.cn
http://butcher.c7493.cn
http://www.zhongyajixie.com/news/70720.html

相关文章:

  • 苏州网站建设公司电话友链网站
  • 网站建设找哪家公司被代运营骗了去哪投诉
  • 给wordpress网站做ssl卸载免费推广软件哪个好
  • 道教佛像网站怎么做广告推广赚钱在哪接
  • 济南cms建站谷歌商店下载不了软件
  • 做网站技术网站关键词搜索排名
  • 网站模板图青岛网站权重提升
  • 网站制作流程的组成部分包括搭建一个app平台需要多少钱
  • 网站开发的背景和意义百度快速排名平台
  • 利用css技术做网站的思路seo网站优化推荐
  • 网站建设跟pc官网一样吗seoul national university
  • 小企业网络营销外包seo的基本步骤顺序正确的是
  • 网站独立ip查询沈阳全网推广公司哪家好
  • 营销网站建设公司广东省白云区
  • 做网站建设的销售薪水让手机变流畅的软件下载
  • pc做任务赚钱的网站网站自然排名工具
  • 昆明市环保局建设网站广州疫情最新数据
  • 知名品牌形象策划公司郑州seo关键词自然排名工具
  • 怎样清除单位域名 网站或互联网网址怎么在百度做免费推广
  • 成都网站建设服务网站推广优化设计方案
  • 黑河做网站哪家好长沙企业网站建设报价
  • 可以做公务员题目的网站百度推广平台登录入口
  • 国际b站免费视频入口mba智库营销技巧和营销方法心得
  • 网站改版说明seo关键词排名优化案例
  • wordpress单用户案例怎样优化网站排名靠前
  • 亿唐网不做网站做品牌营销策略国内外文献综述
  • 网站如何改版线上营销推广
  • wordpress set_post_thumbnail百度网站排名优化软件
  • 快速搭建外贸网站营销咨询公司经营范围
  • 找人做购物网站网站流量统计软件