为了账号安全,请及时绑定邮箱和手机立即绑定

在熊猫中仅通过两列重塑

在熊猫中仅通过两列重塑

qq_遁去的一_1 2022-08-02 18:45:36
这应该是一个简单的问题,但我认为我只是错过了我应该搜索的关键字。假设我有一个两列长的数据集,如下所示:test = pd.DataFrame(       {          'color': ['white', 'white', 'white',                     'red', 'red', 'red',                     'black', 'black', 'black'],           'value': [1,2,3,4,5,6,7,8,9]       })如何将其转换为以下格式:    white   red    black    1        4       7    2        5       8     3        6       9 我意识到这应该是一个简单的枢轴函数,例如:test.pivot('color', 'value'),但这会产生与周围 NaN 的对角线中的值。有什么办法可以解决这个问题吗?
查看完整描述

3 回答

?
catspeake

TA贡献1111条经验 获得超0个赞

尝试:


test["id"]=test.groupby("color")["color"].cumcount()


test.pivot(index="id", columns="color", values="value")

输出:


color  black  red  white

id

0          7    4      1

1          8    5      2

2          9    6      3


查看完整回答
反对 回复 2022-08-02
?
白衣非少年

TA贡献1155条经验 获得超0个赞

我已经使用pandas库使用分组函数做了一些快速解决方案


 for i in test.groupby('color'):

     print(i[0])

     for j in range(len(i[1])):

         for k in i[1].values:

             print(k[1])

         break 

输出:


black

7

9

red

4  

5

6

white

1

2

3


查看完整回答
反对 回复 2022-08-02
?
富国沪深

TA贡献1790条经验 获得超9个赞

您可以从以下 3 个系列中创建序列、重置索引以及重新创建数据帧:


df = pd.DataFrame({'color': ['white', 'white', 'white', 'red', 'red', 'red', 'black', 'black', 'black'],

'value': [1,2,3,4,5,6,7,8,9]})


serie_white = df['value'][df['color'] == "white"].reset_index(drop=True)

serie_red = df['value'][df['color'] == "red"].reset_index(drop=True)

serie_black = df['value'][df['color'] == "black"].reset_index(drop=True)


result = pd.DataFrame({'white': serie_white, 'red': serie_red, 'black': serie_black})

print(result)

输出:


   white  red  black

0      1    4      7

1      2    5      8

2      3    6      9


查看完整回答
反对 回复 2022-08-02
  • 3 回答
  • 0 关注
  • 128 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号

OSZAR »