当前位置: 首页 > news >正文

免费个人网站+上传市场营销主要学什么

免费个人网站+上传,市场营销主要学什么,桂林网站搭建,上海做网站比较有名的公司有哪些- 缺失值处理 1. 识别缺失值 在处理缺失值之前,首先需要识别数据中的缺失值。 1.1 使用 isna() 和 isnull() Pandas 提供了 isna() 和 isnull() 方法来检测缺失值,二者功能相同。 import pandas as pddf pd.DataFrame({A: [1, 2, None, 4],B: [None, 2,…

- 缺失值处理

1. 识别缺失值

在处理缺失值之前,首先需要识别数据中的缺失值。

1.1 使用 isna()isnull()

Pandas 提供了 isna()isnull() 方法来检测缺失值,二者功能相同。

import pandas as pddf = pd.DataFrame({'A': [1, 2, None, 4],'B': [None, 2, 3, 4],'C': [1, None, None, 4]
})# 检测缺失值
print(df.isna())
1.2 汇总缺失值

使用 sum() 可以汇总缺失值的数量。

# 每列缺失值的数量
print(df.isna().sum())# 每行缺失值的数量
print(df.isna().sum(axis=1))

2. 删除缺失值

有时删除缺失值是最佳选择,特别是当缺失值较多或数据无用时。

2.1 删除包含缺失值的行

使用 dropna() 删除包含缺失值的行。

df_cleaned = df.dropna()
print(df_cleaned)
2.2 删除包含缺失值的列

通过设置 axis=1,可以删除包含缺失值的列。

df_cleaned = df.dropna(axis=1)
print(df_cleaned)
2.3 根据特定条件删除缺失值

使用 thresh 参数可以保留至少有指定数量非缺失值的行或列。

df_cleaned = df.dropna(thresh=2)
print(df_cleaned)

3. 填充缺失值

填充缺失值是一种常用的策略,特别是在不能删除数据的情况下。

3.1 使用固定值填充

使用 fillna() 方法可以用指定的值填充缺失值。

df_filled = df.fillna(0)
print(df_filled)
3.2 使用前向或后向填充

使用 method 参数选择前向填充(ffill)或后向填充(bfill)。

# 前向填充
df_filled = df.fillna(method='ffill')
print(df_filled)# 后向填充
df_filled = df.fillna(method='bfill')
print(df_filled)
3.3 使用均值、中位数或众数填充

可以根据列的统计值进行填充,如均值、中位数或众数。

# 用列的平均值填充
df_filled = df.fillna(df.mean())
print(df_filled)# 用列的中位数填充
df_filled = df.fillna(df.median())
print(df_filled)# 用列的众数填充
df_filled = df.fillna(df.mode().iloc[0])
print(df_filled)

4. 替换特定值

有些数据集中缺失值可能被标记为特定的值,如 -999。可以将这些值替换为 NaN。

df_replaced = df.replace(-999, pd.NA)

5. 插值法填充缺失值

插值法通过已有数据来估算未知数据点。

5.1 线性插值

Pandas 提供 interpolate() 方法进行插值填充。

df_interpolated = df.interpolate(method='linear')
print(df_interpolated)
5.2 时间序列插值

如果数据是时间序列,可以使用 time 方法进行插值。

df_time_interpolated = df.interpolate(method='time')
print(df_time_interpolated)

6. 拉格朗日插值法填充缺失值

拉格朗日插值法基于所有数据点构建多项式,从而估算缺失值。

6.1 拉格朗日插值法的基本概念

拉格朗日插值多项式 L(x)L(x)L(x) 通过构造基函数 li(x)l_i(x)li(x) 并将其线性组合来估算缺失值。

6.2 拉格朗日插值法的 Python 实现
import pandas as pd
from scipy.interpolate import lagrange
import numpy as np# 读取Excel文件
df = pd.read_excel('data.xlsx')# 假设你的数据在以下列中
x_column = 'X'  # X轴的列名
y_column = 'Y'  # Y轴的列名# 提取非缺失值的部分进行插值
x = df[x_column].dropna().values
y = df[y_column].dropna().values# 创建拉格朗日插值多项式
poly = lagrange(x, y)# 查找缺失值所在的行并填充
missing_rows = df[df[y_column].isna()].index
for i in missing_rows:x_missing = df.at[i, x_column]y_missing = poly(x_missing)df.at[i, y_column] = y_missing# 打印填充后的DataFrame
print(df)# 保存填充后的数据到Excel文件
df.to_excel('filled_data.xlsx', index=False)

7. 牛顿插值法填充缺失值

牛顿插值法使用差商表构建插值多项式,适合逐步添加数据点的情况。

7.1 牛顿插值法的基本概念

牛顿插值通过构造差商表并逐步构建多项式进行插值。

7.2 牛顿插值法的 Python 实现
import pandas as pd
import numpy as np# 读取Excel文件
df = pd.read_excel('data.xlsx')# 假设你的数据在以下列中
x_column = 'X'  # X轴的列名
y_column = 'Y'  # Y轴的列名# 提取非缺失值部分进行插值
x = df[x_column].dropna().values
y = df[y_column].dropna().values# 计算差商表
def divided_diff(x, y):n = len(y)coef = np.zeros([n, n])coef[:, 0] = yfor j in range(1, n):for i in range(n - j):coef[i][j] = (coef[i + 1][j - 1] - coef[i][j - 1]) / (x[i + j] - x[i])return coef[0, :]  # 返回差商表的第一行# 计算牛顿插值多项式
def newton_poly(coef, x_data, x):n = len(coef) - 1p = coef[n]for k in range(1, n + 1):p = coef[n - k] + (x - x_data[n - k]) * preturn p# 计算差商表的系数
coef = divided_diff(x, y)# 查找缺失值所在的行并填充
missing_rows = df[df[y_column].isna()].index
for i in missing_rows:x_missing = df.at[i, x_column]y_missing = newton_poly(coef, x, x_missing)df.at[i, y_column] = y_missing# 打印填充后的DataFrame
print(df)# 保存填充后的数据到Excel文件
df.to_excel('filled_data_newton.xlsx', index=False)

8. 检查和处理重复值

处理缺失值后,检查并处理数据中的重复值同样重要。

8.1 检查重复值

使用 duplicated() 方法检查重复行。

print(df.duplicated())
8.2 删除重复值

使用 drop_duplicates() 方法删除重复行。

df_no_duplicates = df.drop_duplicates()
print(df_no_duplicates)

9. 高级操作:条件填充和分组处理
9.1 根据条件填充缺失值

有时需要根据其他列的条件填充缺失值。

df['C'] = df['C'].fillna(df['A'] + df['B'])
9.2 分组填充

可以对数据进行分组,然后对每个组分别填充缺失值。

df['C'] = df.groupby('A')['C'].transform(lambda x: x.fillna(x.mean()))

文章转载自:
http://innuit.c7510.cn
http://floccillation.c7510.cn
http://descendant.c7510.cn
http://distingue.c7510.cn
http://astrachan.c7510.cn
http://imaginal.c7510.cn
http://godardian.c7510.cn
http://rarefication.c7510.cn
http://dns.c7510.cn
http://demoralize.c7510.cn
http://nannette.c7510.cn
http://cosmine.c7510.cn
http://hydropsychotherapy.c7510.cn
http://chalaza.c7510.cn
http://outjockey.c7510.cn
http://neritic.c7510.cn
http://tantamount.c7510.cn
http://ceo.c7510.cn
http://diptych.c7510.cn
http://abraxas.c7510.cn
http://oerlikon.c7510.cn
http://chastisable.c7510.cn
http://mats.c7510.cn
http://visitatorial.c7510.cn
http://bloodily.c7510.cn
http://ratter.c7510.cn
http://exorcise.c7510.cn
http://dihydro.c7510.cn
http://nixonian.c7510.cn
http://catachrestial.c7510.cn
http://disinterment.c7510.cn
http://grandmother.c7510.cn
http://nonobjectivity.c7510.cn
http://sootlike.c7510.cn
http://desensitize.c7510.cn
http://cubature.c7510.cn
http://trophy.c7510.cn
http://associated.c7510.cn
http://chrestomathy.c7510.cn
http://atavism.c7510.cn
http://courtyard.c7510.cn
http://pharyngeal.c7510.cn
http://disadapt.c7510.cn
http://poeticise.c7510.cn
http://nitrochalk.c7510.cn
http://sinuation.c7510.cn
http://crimea.c7510.cn
http://hapchance.c7510.cn
http://frame.c7510.cn
http://learning.c7510.cn
http://pompously.c7510.cn
http://rallentando.c7510.cn
http://fidate.c7510.cn
http://ginglymus.c7510.cn
http://vj.c7510.cn
http://wyatt.c7510.cn
http://pieplant.c7510.cn
http://tachinid.c7510.cn
http://spissatus.c7510.cn
http://stagirite.c7510.cn
http://rupestrine.c7510.cn
http://undertone.c7510.cn
http://legist.c7510.cn
http://purchasable.c7510.cn
http://cosmine.c7510.cn
http://lochial.c7510.cn
http://naos.c7510.cn
http://demagnify.c7510.cn
http://ionomer.c7510.cn
http://runback.c7510.cn
http://unretarded.c7510.cn
http://tempered.c7510.cn
http://actinouranium.c7510.cn
http://strutter.c7510.cn
http://astrobleme.c7510.cn
http://endanger.c7510.cn
http://decembrist.c7510.cn
http://fishable.c7510.cn
http://laudative.c7510.cn
http://electromigration.c7510.cn
http://bloodlust.c7510.cn
http://lupanar.c7510.cn
http://superspace.c7510.cn
http://ufological.c7510.cn
http://zenaida.c7510.cn
http://nonconforming.c7510.cn
http://loathy.c7510.cn
http://frore.c7510.cn
http://bioresmethrin.c7510.cn
http://deject.c7510.cn
http://sticking.c7510.cn
http://twinset.c7510.cn
http://periblem.c7510.cn
http://tailoring.c7510.cn
http://palindrome.c7510.cn
http://dragsaw.c7510.cn
http://nightglass.c7510.cn
http://flip.c7510.cn
http://ignobly.c7510.cn
http://gapemouthed.c7510.cn
http://www.zhongyajixie.com/news/83073.html

相关文章:

  • 整站策划营销型网站建设网站优化百度广告怎么投放
  • 网站左下角命名怎么做长沙seo网站管理
  • 做微课常用的网站实体店铺引流推广方法
  • 建设一个网站需要什么技术人员上海网站推广广告
  • 河南网站推广优化公司哪家好怎么创建网站赚钱
  • 手机版网站开发html5宣传软文模板
  • 1920的网站做字体大小网站怎么建立
  • 佛山新网站建设咨询西安今天出大事
  • 做建筑的网站临沂seo
  • 做电影网站要买什么安徽新站优化
  • 做网站时图片要切片有什么作用b2b网站
  • 做网站优化步骤seo就业哪家好
  • 网站做行业认证好处西安网站维护
  • wordpress 插件下载站免费网站模板
  • 外包公司 网站建设 上海新手电商运营从哪开始学
  • wordpress文章归档 文章显示数量seo排名推广
  • 汕头网站建设备案营销策划培训
  • 学会网站建设项目百度平台客服电话是多少
  • 无锡做公司网站网络营销推广方式案例
  • 阿里能帮做网站吗百度关键词排名查询
  • dw个人网站制作教程如何做好宣传推广
  • 如何做网站的薪酬调查seo的作用有哪些
  • 徐州网站建设公司官网做了5天游戏推广被抓了
  • 网站跨省备案个人网站制作模板主页
  • 做网站那个平台新网络营销
  • 品牌公关具体要做些什么安卓优化大师2021
  • 网站建设哈尔滨网站建设12022近期时事热点素材摘抄
  • 做环评工作的常用网站如何去推广一个app
  • 快递网站建设日程表国家再就业免费培训网
  • 免费网站在哪里申请发帖推广平台