python数据框循环生成_python - 如何在 Pandas 的for循环迭代中创建多个数据框?

我需要在熊猫中创建一个函数,该函数将单个数据框作为输入,并根据特定条件返回多个数据框作为输出。 (请检查下面的示例以了解情况)。我很难弄清楚如何做。我需要一些专家的编码建议。

范例1:

输入= 100列的数据框

输出=数据帧1的前10%列(第1到10列),数据帧2的后10%列(第11到20列),依此类推,直到最后10%的列(第91到100列)。

范例2:

输入= 109列的数据框

输出=列的前10%的dataframe1(四舍五入)(第1到11列),列的后10%的dataframe2(第12到23列),依此类推,直到最后10%的列(第109列)

这是我尝试开发的逻辑:

从总数的10%值中找到原始数据帧中的列为'n'

从原始数据框中选择第一个“ n”列。

将它们添加到新的数据框

从原始数据框中删除它们

检查原始数据帧中的列总数是否大于“ n”

如果否->重复步骤2至步骤5。

如果是->将所有剩余的列添加到最后创建的列

数据框。

我尝试了以下代码,但这是错误的。在下面的代码中,我尝试基于拆分百分比获取受尊重的列号,稍后我计划使用iloc函数使用这些数字拆分数据帧。def split_column_numbers(total_columns, percentage_split):

list1 = []

number = round((total_columns * (percentage_split/100)))

list1.append([0,number])

for i in range(number):

last_num = list1[-1][-1]

if (last_num < total_columns):

if((total_columns-last_num) > number):

list1.append([last_num+1, last_num+number])

else:

list1.append([last_num+1, total_columns])

return list1

split_column_numbers(101, 10)

谁能帮我这个逻辑是否正确以及如何实现?

最佳答案

如果将框架直接传递给该函数,则应该使您更容易确定以后要抓取的列。我们可以使用math.ceil进行四舍五入,并使用itertools.zip_longest划分为子组。from itertools import zip_longest

from math import ceil

def split_columns(frame, percentage_split):

cols = frame.columns

grp_size = ceil(len(cols) * percentage_split/100)

return [[c for c in grp if c] for grp in zip_longest(*(iter(cols),) * grp_size)]

例如,如果我们按如下所示设置一个虚拟框架:

from string import ascii_lowercase

import pandas as pd

tmp = pd.DataFrame(columns=list(ascii_lowercase))

然后,如果我们执行split_columns(tmp, 10),则会得到:

[['a', 'b', 'c'],

['d', 'e', 'f'],

['g', 'h', 'i'],

['j', 'k', 'l'],

['m', 'n', 'o'],

['p', 'q', 'r'],

['s', 't', 'u'],

['v', 'w', 'x'],

['y', 'z']]

如果我们执行split_columns(tmp, 30),则会得到:

[['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h'],

['i', 'j', 'k', 'l', 'm', 'n', 'o', 'p'],

['q', 'r', 's', 't', 'u', 'v', 'w', 'x'],

['y', 'z']]

然后,如果我们要使用这些列选择来创建新框架,则可以使用字典理解和enumerate来实现:

frames = {i: tmp[cols] for i, cols in enumerate(split_columns(tmp, 30))}

这给了我们一个字典,其中的键是整数(第一组列对应于0,第二组对应于1等),值是从数据帧中选择的列。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/475423.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

除去数组中的空字符元素array_filter()

除去数组中的空字符元素 <?php$str1_arrayarray(电影618,,http://www.movie618.com,,1654,);$str1_arrayarray_filter($str1_array);print_r($str1_array); ?> 显示结果&#xff1a; Array( [0] > 电影618 [2] > http://www.movie618.com [4] > …

Hive的数据加载与导出

普通表的加载 1.load方式 load data [local] inpath [源文件路径] into table 目标表名; 从HDFS上加载数据&#xff0c;本质上是移动文件所在的路径 load data inpath /user/student.txt into table student; 从本地加载数据&#xff0c;本质上是复制本地的文件到HDFS上 lo…

电压压力蕊片_一文让你知道什么是压力变送器

一般来说&#xff0c;压力变送器主要由测压元件传感器(也称作压力传感器)、测量电路和过程连接件三部分组成。它能将测压元件传感器感受到的气体、液体等物理压力参数转变成标准的电信号(如4~20mADC等)&#xff0c;以供给指示报警仪、记录仪、调节器等二次仪表进行测量、指示和…

LeetCode 1497. 检查数组对是否可以被 k 整除(余数配对)

1. 题目 给你一个整数数组 arr 和一个整数 k &#xff0c;其中数组长度是偶数&#xff0c;值为 n 。 现在需要把数组恰好分成 n / 2 对&#xff0c;以使每对数字的和都能够被 k 整除。 如果存在这样的分法&#xff0c;请返回 True &#xff1b;否则&#xff0c;返回 False 。…

C# 多线程编程 ThreadStart ParameterizedThreadStart

原文地址&#xff1a;http://club.topsage.com/thread-657023-1-1.html 在实例化Thread的实例&#xff0c;需要提供一个委托&#xff0c;在实例化这个委托时所用到的参数是线程将来启动时要运行的方法。在.net中提供了两种启动线程的方式&#xff0c;一种是不带参数的启动…

Hive的查找语法

基本语法格式&#xff1a; select [all | DISTINCT ] a.id, a.sname, a.age from student a join student02 b on a.id b.id # 匹配函数 where a.age >18 # 条件语句 group by a.age having a.age >18 # 分组,having:分组后的筛选条件 order by a.age # 全局排序 sort …

动词ing基本用法_动词ing的用法

动词ing的用法2020-09-14 11:41:52文/董月表示现在(指说话人说话时)正在发生的事情&#xff1b;习惯进行&#xff1a;表示长期的或重复性的动作&#xff0c;说话时动作未必正在进行&#xff1b;表示渐变的动词有&#xff1a;get&#xff0c;grow&#xff0c;become&#xff0c;…

LeetCode 1498. 满足条件的子序列数目(排序+二分查找+快速幂)

1. 题目 给你一个整数数组 nums 和一个整数 target 。 请你统计并返回 nums 中能满足其最小元素与最大元素的 和 小于或等于 target 的 非空 子序列的数目。 由于答案可能很大&#xff0c;请将结果对 10^9 7 取余后返回。 示例 1&#xff1a; 输入&#xff1a;nums [3,5,…

Matlab编程学习笔记【待续】

最近想用Matlab进行数据分析&#xff0c;算法性能测试&#xff0c;平时由于用的是C、C&#xff0c;因此很多习惯都一时改不了&#xff0c;这里自己列出来一些Matlab中明显不同的地方。 矩阵单元元素访问方式&#xff1a;A(1,2)---A[1][2]选取矩阵某个行或者列&#xff1a;A(:,1…

Hive的视图

创建视图 create view my_view as select * from student; 注意&#xff1a; hive中的视图仅仅是存储了SQL语句的快捷方式&#xff0c;在查询的时候才执行&#xff1b;hive中的视图只有逻辑视图&#xff0c;没有物化视图&#xff1b;hive中的视图只支持查询&#xff0c;不支…

animation 先执行一次 在持续执行_这一次,彻底弄懂 JavaScript 执行机制

本文来源&#xff1a;ssssyokihttps://juejin.im/post/6844903512845860872不论你是javascript新手还是老鸟&#xff0c;不论是面试求职&#xff0c;还是日常开发工作&#xff0c;我们经常会遇到这样的情况&#xff1a;给定的几行代码&#xff0c;我们需要知道其输出内容和顺序…

[scikit-learn 机器学习] 5. 多元线性回归

文章目录1. 多元线性回归2. 多项式回归3. 正则化4. 线性回归应用举例&#xff08;酒质量预测&#xff09;4.1 数据预览4.2 模型验证5. 梯度下降法本文为 scikit-learn机器学习&#xff08;第2版&#xff09;学习笔记1. 多元线性回归 模型 yαβ1x1β2x2...βnxny \alpha\bet…

mac笔记本修改 mysql 的密码

第一种 mysql版本&#xff1a;5.7.17 1.首先我们要关闭mysql服务 sudo /usr/local/mysql/support-files/mysql.server stop 2.我们要用安全模式启动mysql sudo /usr/local/mysql/bin/mysqld_safe --skip-grant-tables 3.使用root账号登录mysql服务 /usr/local/mysql/bin/mysql …

LeetCode 831. 隐藏个人信息

1. 题目 给你一条个人信息字符串 S&#xff0c;它可能是一个 邮箱地址 &#xff0c;也可能是一串 电话号码 。 我们将隐藏它的隐私信息&#xff0c;通过如下规则: 电子邮箱 定义名称 name 是长度大于等于 2 &#xff08;length ≥ 2&#xff09;&#xff0c;并且只包含小写…

oa项目经验描述_简历中项目经验模版

项目名称&#xff1a;OA(办公自动化)开发工具&#xff1a;MyEclipse 8.6 , Oracle 11g , Tomcat 6.0.18项目描述(1, SSH框架版)&#xff1a;OA主要功能模块分为首页Portlet展示、协同审批、协同工作、日历、资源管理、知识中心、新闻中心、通讯录、系统管理。是一套很好的办公自…

分离

web2.0到处都是分离与聚合的思想&#xff1a; jquery实现了表现层的行为与内容的分离 zendframework为首的mvc架构实现了逻辑架构的控制、模块、表现层的分离 mysql为例的master-slave架构实现了服务与备份的分离 hadoop为首的虚拟化架构实现了单点计算与群体计算的结合 css实现…

hive-内置函数(常用内置函数汇总)

show functions; #查看所有内置函数&#xff0c;共271个 show function sum; #查看sum函数的描述信息 show function extended sum; #查看内置函数的描述信息和举例的使用方法 举例数据表&#xff1a;stu id name address score credit 01 huang hebi,changzhou,dalian …

LeetCode 828. 统计子串中的唯一字符(中心扩展)

1. 题目 我们定义了一个函数 countUniqueChars(s) 来统计字符串 s 中的唯一字符&#xff0c;并返回唯一字符的个数。 例如&#xff1a;s “LEETCODE” &#xff0c;则其中 “L”, “T”,“C”,“O”,“D” 都是唯一字符&#xff0c;因为它们只出现一次&#xff0c;所以 coun…

钢笔的保养

钢笔其实很泼辣的不需要用心的保养&#xff0c;但如果太不注意了&#xff0c;也会早早损毁了一支好笔。所以&#xff0c;为了自己方便地更长久些&#xff0c;还是要保养一下。保养的方法很简单&#xff0c;就是&#xff1a; 用前先浸&#xff0c;墨水不混&#xff0c;定期清洗。…

hive - 自定义函数(超详细步骤,手把手的交)

用Java开发自定义函数&#xff0c;步骤&#xff1a; 1.eclipse上新建一个工程project&#xff08;db2019)&#xff1b; 2.导jar依赖包&#xff1a; db2019右键 --build path --configure... --add library --user library --new(新建一个library(hive2.3.2_jar)) --add ext…