
Security News
Browserslist-rs Gets Major Refactor, Cutting Binary Size by Over 1MB
Browserslist-rs now uses static data to reduce binary size by over 1MB, improving memory use and performance for Rust-based frontend tools.
A light weight tool for creating summary statistics from dataframes.
skimpy is a light weight tool that provides summary statistics about variables in pandas or Polars data frames within the console or your interactive Python window.
Think of it as a super-charged version of pandas' df.describe()
.
You can find the documentation here.
skim
a pandas or polars dataframe and produce summary statistics within the console
using:
from skimpy import skim
skim(df)
where df
is a pandas or polars dataframe.
If you need to a dataset to try skimpy out on, you can use the built-in test Pandas data frame:
from skimpy import generate_test_data, skim
df = generate_test_data()
skim(df)
โญโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโ skimpy summary โโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโฎ โ Data Summary Data Types Categories โ โ โโโโโโโโโโโโโโโโโโโโโณโโโโโโโโโ โโโโโโโโโโโโโโโณโโโโโโโโ โโโโโโโโโโโโโโโโโโโโโโโโโ โ โ โ Dataframe โ Values โ โ Column Type โ Count โ โ Categorical Variables โ โ โ โกโโโโโโโโโโโโโโโโโโโโโโโโโโโโโฉ โกโโโโโโโโโโโโโโโโโโโโโโฉ โกโโโโโโโโโโโโโโโโโโโโโโโโฉ โ โ โ Number of rows โ 1000 โ โ float64 โ 3 โ โ class โ โ โ โ Number of columns โ 13 โ โ category โ 2 โ โ location โ โ โ โโโโโโโโโโโโโโโโโโโโโดโโโโโโโโโ โ datetime64 โ 2 โ โโโโโโโโโโโโโโโโโโโโโโโโโ โ โ โ object โ 2 โ โ โ โ int64 โ 1 โ โ โ โ bool โ 1 โ โ โ โ string โ 1 โ โ โ โ timedelta64 โ 1 โ โ โ โโโโโโโโโโโโโโโดโโโโโโโโ โ โ number โ โ โโโโโโโโโโโณโโโโโโโณโโโโโโโโณโโโโโโโโโโโโณโโโโโโโโโโณโโโโโโโโโโโโโณโโโโโโโโโโณโโโโโโโโโโโโโณโโโโโโโโโณโโโโโโโโณโโโโโโโโโ โ โ โ column โ NA โ NA % โ mean โ sd โ p0 โ p25 โ p50 โ p75 โ p100 โ hist โ โ โ โกโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโฉ โ โ โ length โ 0 โ 0 โ 0.5016 โ 0.3597 โ 1.573e-06 โ 0.134 โ 0.4976 โ 0.8602 โ 1 โ โโโโโ โ โ โ โ โ width โ 0 โ 0 โ 2.037 โ 1.929 โ 0.002057 โ 0.603 โ 1.468 โ 2.953 โ 13.91 โ โโโ โ โ โ โ depth โ 0 โ 0 โ 10.02 โ 3.208 โ 2 โ 8 โ 10 โ 12 โ 20 โ โโโโโโ โ โ โ โ rnd โ 118 โ 11.8 โ -0.01977 โ 1.002 โ -2.809 โ -0.7355 โ -0.0007736 โ 0.6639 โ 3.717 โ โโ โโ โ โ โ โ โโโโโโโโโโโดโโโโโโโดโโโโโโโโดโโโโโโโโโโโโดโโโโโโโโโโดโโโโโโโโโโโโโดโโโโโโโโโโดโโโโโโโโโโโโโดโโโโโโโโโดโโโโโโโโดโโโโโโโโโ โ โ category โ โ โโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโณโโโโโโโโโโโโโณโโโโโโโโโโโโโโโโโโณโโโโโโโโโโโโโโโโโโโโโโโโโโณโโโโโโโโโโโโโโโโโโโโโโ โ โ โ column โ NA โ NA % โ ordered โ unique โ โ โ โกโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโฉ โ โ โ class โ 0 โ 0 โ False โ 2 โ โ โ โ location โ 1 โ 0.1 โ False โ 5 โ โ โ โโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโดโโโโโโโโโโโโโดโโโโโโโโโโโโโโโโโโดโโโโโโโโโโโโโโโโโโโโโโโโโโดโโโโโโโโโโโโโโโโโโโโโโ โ โ bool โ โ โโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโณโโโโโโโโโโโโโโโโโโโณโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโณโโโโโโโโโโโโโโโโโโโโโโโ โ โ โ column โ true โ true rate โ hist โ โ โ โกโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโฉ โ โ โ booly_col โ 516 โ 0.52 โ โ โ โ โ โ โโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโดโโโโโโโโโโโโโโโโโโโดโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโดโโโโโโโโโโโโโโโโโโโโโโโ โ โ datetime โ โ โโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโณโโโโโโโโณโโโโโโโโโโโณโโโโโโโโโโโโโโโโโโโโโณโโโโโโโโโโโโโโโโโโโโณโโโโโโโโโโโโโโโโโโ โ โ โ column โ NA โ NA % โ first โ last โ frequency โ โ โ โกโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโฉ โ โ โ datetime โ 0 โ 0 โ 2018-01-31 โ 2101-04-30 โ ME โ โ โ โ datetime_no_freq โ 3 โ 0.3 โ 1992-01-05 โ 2023-03-04 โ None โ โ โ โโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโดโโโโโโโโดโโโโโโโโโโโดโโโโโโโโโโโโโโโโโโโโโดโโโโโโโโโโโโโโโโโโโโดโโโโโโโโโโโโโโโโโโ โ โ <class 'datetime.date'> โ โ โโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโณโโโโโโโโณโโโโโโโโโโโณโโโโโโโโโโโโโโโโโโโณโโโโโโโโโโโโโโโโโโโณโโโโโโโโโโโโโโโโโ โ โ โ column โ NA โ NA % โ first โ last โ frequency โ โ โ โกโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโฉ โ โ โ datetime.date โ 0 โ 0 โ 2018-01-31 โ 2101-04-30 โ ME โ โ โ โ datetime.date_no_freq โ 0 โ 0 โ 1992-01-05 โ 2023-03-04 โ None โ โ โ โโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโดโโโโโโโโดโโโโโโโโโโโดโโโโโโโโโโโโโโโโโโโดโโโโโโโโโโโโโโโโโโโดโโโโโโโโโโโโโโโโโ โ โ timedelta64 โ โ โโโโโโโโโโโโโโโโโโณโโโโโโโณโโโโโโโโโโณโโโโโโโโโโโโโโโโโโโโโโโโโณโโโโโโโโโโโโโโโโโโโโโโโโโณโโโโโโโโโโโโโโโโโโโโโโโโโ โ โ โ column โ NA โ NA % โ mean โ median โ max โ โ โ โกโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโฉ โ โ โ time diff โ 5 โ 0.5 โ 8 days 00:05:47 โ 0 days 00:00:00 โ 26 days 00:00:00 โ โ โ โโโโโโโโโโโโโโโโโโดโโโโโโโดโโโโโโโโโโดโโโโโโโโโโโโโโโโโโโโโโโโโดโโโโโโโโโโโโโโโโโโโโโโโโโดโโโโโโโโโโโโโโโโโโโโโโโโโ โ โ string โ โ โโโโโโโโโโณโโโโโณโโโโโโโณโโโโโโโโโโโโโณโโโโโโโโโโโโณโโโโโโโโโโโโโณโโโโโโโโโโโโณโโโโโโโโโโโโโณโโโโโโโโโโโโณโโโโโโโโโโโโโ โ โ โ โ โ โ โ โ โ โ chars per โ words per โ total โ โ โ โ column โ NA โ NA % โ shortest โ longest โ min โ max โ row โ row โ words โ โ โ โกโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโฉ โ โ โ text โ 6 โ 0.6 โ How are โ Indeed, โ How are โ What โ 31.1 โ 5.8 โ 5761 โ โ โ โ โ โ โ you? โ it was โ you? โ weather! โ โ โ โ โ โ โ โ โ โ โ the most โ โ โ โ โ โ โ โ โ โ โ โ โ outrageou โ โ โ โ โ โ โ โ โ โ โ โ โ sly โ โ โ โ โ โ โ โ โ โ โ โ โ pompous โ โ โ โ โ โ โ โ โ โ โ โ โ cat I โ โ โ โ โ โ โ โ โ โ โ โ โ have ever โ โ โ โ โ โ โ โ โ โ โ โ โ seen. โ โ โ โ โ โ โ โ โโโโโโโโโโดโโโโโดโโโโโโโดโโโโโโโโโโโโโดโโโโโโโโโโโโดโโโโโโโโโโโโโดโโโโโโโโโโโโดโโโโโโโโโโโโโดโโโโโโโโโโโโดโโโโโโโโโโโโโ โ โ object โ โ โโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโณโโโโโโโโโโโโโโโณโโโโโโโโโโโโโโโโโโโโ โ โ โ column โ NA โ NA % โ โ โ โกโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโฉ โ โ โ datetime.date โ 0 โ 0 โ โ โ โ datetime.date_no_freq โ 0 โ 0 โ โ โ โโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโดโโโโโโโโโโโโโโโดโโโโโโโโโโโโโโโโโโโโ โ โฐโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโ End โโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโฏ
It is recommended that you set your datatypes before using skimpy (for example converting any text columns to pandas string datatype), as this will produce richer statistical summaries. However, the skim()
function will try and guess what the datatypes of your columns are.
You can find a full list of requirements in the pyproject.toml file.
You can try this package out right now in your browser using this Google Colab notebook (requires a Google account). Note that the Google Colab notebook uses the latest package released on PyPI (rather than the development release).
You can install the latest release of skimpy via pip from PyPI:
$ pip install skimpy
To install the development version from git, use:
$ pip install git+https://github.com/aeturrell/skimpy.git
For development, see contributing.
Distributed under the terms of the MIT license, skimpy is free and open source software.
If you encounter any problems, please file an issue along with a detailed description.
This project was generated from @cjolowicz's Hypermodern Python Cookiecutter template.
skimpy was inspired by the R package skimr and by exploratory Python packages including ydata_profiling and dataprep, from which the clean_columns
function comes.
This package would not have been possible without the Rich package.
The package is built with poetry, while the documentation is built with Quarto and Quartodoc (a Python package). Tests are run with nox.
Using skimpy in your paper? Let us know by raising an issue beginning with "citation" and we'll add it to this page.
FAQs
skimpy
We found that skimpy demonstrated a healthy version release cadence and project activity because the last version was released less than a year ago.ย It has 1 open source maintainer collaborating on the project.
Did you know?
Socket for GitHub automatically highlights issues in each pull request and monitors the health of all your open source dependencies. Discover the contents of your packages and block harmful activity before you install or update your dependencies.
Security News
Browserslist-rs now uses static data to reduce binary size by over 1MB, improving memory use and performance for Rust-based frontend tools.
Research
Security News
Eight new malicious Firefox extensions impersonate games, steal OAuth tokens, hijack sessions, and exploit browser permissions to spy on users.
Security News
The official Go SDK for the Model Context Protocol is in development, with a stable, production-ready release expected by August 2025.