当前位置: 首页 > news >正文

安卓应用开发环境seo自媒体运营技巧

安卓应用开发环境,seo自媒体运营技巧,宁波做网站建设推广,ui培训费用pandas.DataFrame 也有一个 mode() 方法。 以下面的 pandas.DataFrame 为例。 df pd.DataFrame({‘col1’: [‘X’, ‘X’, ‘Y’, ‘X’], ‘col2’: [‘X’, ‘Y’, ‘Y’, ‘X’]}, index[‘row1’, ‘row2’, ‘row3’, ‘row4’]) print(df) col1 col2 row1 X X row2…

pandas.DataFrame 也有一个 mode() 方法。
以下面的 pandas.DataFrame 为例。

df = pd.DataFrame({‘col1’: [‘X’, ‘X’, ‘Y’, ‘X’],
‘col2’: [‘X’, ‘Y’, ‘Y’, ‘X’]},
index=[‘row1’, ‘row2’, ‘row3’, ‘row4’])
print(df)

col1 col2

row1 X X

row2 X Y

row3 Y Y

row4 X X

按列获取模式
从pandas.DataFrame调用mode()方法返回一个pandas.DataFrame,其元素默认为每一列的众数值。请注意,即使只有一种模式,也会返回一行的 pandas.DataFrame,如上面的 pandas.Series 示例所示。

如果模式数因列而异,则空白部分将成为缺失值 NaN。

print(df.mode())

col1 col2

0 X X

1 NaN Y

print(type(df.mode()))

<class ‘pandas.core.frame.DataFrame’>

可以通过count()方法获取每一列中模态值的个数,该方法统计的是不为缺失值NaN的元素个数。

print(df.mode().count())

col1 1

col2 2

dtype: int64

生成的 pandas.DataFrame 的第一行将是每列的模式(如果有多个,则为其中一个)。第一行可以通过iloc[0]获得。

04_Pandas获取和修改任意位置的值(at,iat,loc,iloc)
print(df.mode().iloc[0])

col1 X

col2 X

Name: 0, dtype: object

从pandas.DataFrame中调用mode()选择列可能会包含缺失值NaN,但是先选择列再调用mode()作为pandas.Series是不包含缺失值NaN的

print(df.mode()[‘col1’])

0 X

1 NaN

Name: col1, dtype: object

print(df[‘col1’].mode())

0 X

dtype: object

它可能不是很有用,但是如果你用 apply() 方法从每一列调用 mode() 并用 tolist() 列出它,也可以得到一个以列表(列表类型)作为元素的 pandas.Series。

l_mode = df.apply(lambda x: x.mode().tolist())
print(l_mode)

col1 [X]

col2 [X, Y]

dtype: object

print(l_mode.iat[1])

[‘X’, ‘Y’]

print(type(l_mode.iat[1]))

<class ‘list’>

print(l_mode.iat[1][1])

Y

print(type(l_mode.iat[1][1]))

此时,生成的 pandas.Series 的行名索引变成了原始 pandas.DataFrame 的列名。注意,如果原来的列名是数字,选择结果pandas.Series的值为[number]会报错,必须是iat[number]。例子中是字符串,所以[Number]没有问题。

每行获取模式
如果设置参数 axis=1,则可以获得每一行的模式。

print(df.mode(axis=1))

0 1

row1 X NaN

row2 X Y

row3 Y NaN

row4 X NaN

计数不是缺失值 NaN 的元素数量的 count() 方法也有一个参数轴。

print(df.mode(axis=1).count(axis=1))

row1 1

row2 2

row3 1

row4 1

dtype: int64

在 pandas 中,每一列都有一个类型 dtype,所以基本上假设每一列都排列了相同类型的数据。

因此,通常不需要获取每一行的众数,如果每一行排列的是同类数据,转置可能会更好。

df_t = df.T
print(df_t)

row1 row2 row3 row4

col1 X X Y X

col2 X Y Y X

print(df_t.mode())

row1 row2 row3 row4

0 X X Y X

1 NaN Y NaN NaN

获取模式的频率(出现次数)
可以使用 pandas.Series 的 value_counts() 方法获取模式的频率(出现次数)。

value_counts() 返回一个 pandas.Series,其唯一元素值为 index,其频率(出现次数)为 data。

默认情况下,pandas.Series 按出现的降序排序,因此 value_counts() 方法返回的 pandas.Series 中的第一个值是模式的频率。

print(df[‘col1’].value_counts())

X 3

Y 1

Name: col1, dtype: int64

print(df[‘col1’].value_counts().iat[0])

3

原始 pandas.Series 的元素成为生成的 pandas.Series 的索引。如果数值为index,则不能用[number]指定值(会报错),所以使用iat [number]严格指定。 (由于上面的例子是字符串,所以[number]是没有问题的)

使用 apply() 获取每列模式的频率。

print(df.apply(lambda x: x.value_counts().iat[0]))

col1 3

col2 2

dtype: int64

describe() 方法计算每一列的汇总统计信息,还获取众数及其频率。

print(df.describe())

col1 col2

count 4 4

unique 2 2

top X Y

freq 3 2

项目 top 是模式, freq 是它的频率。如果有多种模式,则只返回其中一种。结果是一个 pandas.DataFrame,因此您可以使用 loc、at 等获取行和元素。

print(df.describe().loc[‘freq’])

col1 3

col2 2

Name: freq, dtype: object

print(df.describe().at[‘freq’, ‘col2’])

2

describe() 没有参数轴,因此如果要将它应用于一条线,请在调用它之前转置它。

print(df.T.describe())

row1 row2 row3 row4

count 2 2 2 2

unique 1 2 1 1

top X Y Y X

freq 2 1 2 2

http://www.zhongyajixie.com/news/61162.html

相关文章:

  • 采集wordpress整站数据怎么从网上找客户
  • 做金融网站需要什么营业执照大数据培训班出来能就业吗
  • drupal还是wordpress好北京优化网站方法
  • 益阳做网站的公司怎么网站推广
  • 五金公司宣传册设计样本烟台seo
  • 郑州建站公司网站外链交易平台
  • 做网站运营工资是不是很低百度手机浏览器下载
  • 网站交互式重庆森林在线观看
  • 微信客户端网站建设网络营销的盈利模式
  • 大良网站智能推广机构独立站怎么建站
  • 如何做电影下载网站google免登录网页版
  • wordpress登陆注册界面360网站关键词排名优化
  • 西安知名网站建设公司排名关键词搜索量排名
  • 淄博易宝网站建设在线域名查询网站
  • 百度推广怎么做的网站免费建站软件
  • 莱芜哪家企业做网站免费友情链接网
  • 建设学校网站前的需求分析网页搜索关键词
  • 做批发网站seo顾问合同
  • 好的h5网站互联网营销的优势
  • 可以做请柬的网站深圳网络推广培训
  • 网络营销推广总结系统优化的意义
  • 企业网站建设情况百度品牌
  • 闸北专业做网站搜索引擎关键词seo优化公司
  • 网站建设课程设计心得汽车营销策划方案ppt
  • 北京企业做网站费用合肥网络推广平台
  • 武汉模板网站制作广州网络推广seo
  • 诸城公司做网站百度关键词排名提升工具
  • 保定做网站多钱东莞网站公司排名
  • 制作付款网站b站推广网站
  • david网站做go富集分析重庆seo技术