{
"cells": [
{
"cell_type": "code",
"execution_count": 198,
"metadata": {},
"outputs": [],
"source": [
"import pandas as pd\n",
"import numpy as np\n",
"import pandas_profiling\n",
"\n",
"from sklearn.model_selection import train_test_split\n",
"from sklearn.metrics import accuracy_score,f1_score\n",
"\n",
"df = pd.read_csv('train.csv')"
]
},
{
"cell_type": "code",
"execution_count": 199,
"metadata": {},
"outputs": [
{
"data": {
"text/plain": [
"array(['Sales & Marketing', 'Operations', 'Technology', 'Analytics', 'R&D',\n",
" 'Procurement', 'Finance', 'HR', 'Legal'], dtype=object)"
]
},
"execution_count": 199,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"df['department'].unique()"
]
},
{
"cell_type": "code",
"execution_count": 200,
"metadata": {},
"outputs": [],
"source": [
"df.drop(['employee_id','recruitment_channel','region','gender'], axis=1, inplace = True, index = None)\n",
"df['previous_year_rating'].fillna(0, inplace=True)\n",
"df.drop_duplicates(keep='first', inplace=True)"
]
},
{
"cell_type": "code",
"execution_count": 201,
"metadata": {
"scrolled": true
},
"outputs": [
{
"data": {
"text/html": [
"\n",
"\n",
"\n",
"\n",
"
\n",
"
\n",
"
Overview
\n",
" \n",
"
\n",
"
\n",
"
Dataset info
\n",
"
\n",
" \n",
" \n",
" Number of variables | \n",
" 11 | \n",
"
\n",
" \n",
" Number of observations | \n",
" 47563 | \n",
"
\n",
" \n",
" Total Missing (%) | \n",
" 0.4% | \n",
"
\n",
" \n",
" Total size in memory | \n",
" 4.0 MiB | \n",
"
\n",
" \n",
" Average record size in memory | \n",
" 88.0 B | \n",
"
\n",
" \n",
"
\n",
"
\n",
"
\n",
"
Variables types
\n",
"
\n",
" \n",
" \n",
" Numeric | \n",
" 6 | \n",
"
\n",
" \n",
" Categorical | \n",
" 2 | \n",
"
\n",
" \n",
" Boolean | \n",
" 3 | \n",
"
\n",
" \n",
" Date | \n",
" 0 | \n",
"
\n",
" \n",
" Text (Unique) | \n",
" 0 | \n",
"
\n",
" \n",
" Rejected | \n",
" 0 | \n",
"
\n",
" \n",
" Unsupported | \n",
" 0 | \n",
"
\n",
" \n",
"
\n",
"
\n",
"
\n",
" \n",
"
Warnings
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Variables
\n",
" \n",
"
\n",
"
\n",
"
80%\">KPIs_met >80%
\n",
" Boolean\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 2 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Mean | \n",
" 0.36724 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" 0 | \n",
" \n",
" \n",
" 30096\n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" \n",
" \n",
" 17467\n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0 | \n",
" 30096 | \n",
" 63.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" 17467 | \n",
" 36.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
age
\n",
" Numeric\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 41 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.1% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
" \n",
" Infinite (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Infinite (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"\n",
" \n",
" Mean | \n",
" 35.406 | \n",
"
\n",
" \n",
" Minimum | \n",
" 20 | \n",
"
\n",
" \n",
" Maximum | \n",
" 60 | \n",
"
\n",
" \n",
" Zeros (%) | \n",
" 0.0% | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
Quantile statistics
\n",
"
\n",
" \n",
" Minimum | \n",
" 20 | \n",
"
\n",
" \n",
" 5-th percentile | \n",
" 25 | \n",
"
\n",
" \n",
" Q1 | \n",
" 30 | \n",
"
\n",
" \n",
" Median | \n",
" 34 | \n",
"
\n",
" \n",
" Q3 | \n",
" 40 | \n",
"
\n",
" \n",
" 95-th percentile | \n",
" 52 | \n",
"
\n",
" \n",
" Maximum | \n",
" 60 | \n",
"
\n",
" \n",
" Range | \n",
" 40 | \n",
"
\n",
" \n",
" Interquartile range | \n",
" 10 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Descriptive statistics
\n",
"
\n",
" \n",
" Standard deviation | \n",
" 7.8381 | \n",
"
\n",
" \n",
" Coef of variation | \n",
" 0.22138 | \n",
"
\n",
" \n",
" Kurtosis | \n",
" 0.5402 | \n",
"
\n",
" \n",
" Mean | \n",
" 35.406 | \n",
"
\n",
" \n",
" MAD | \n",
" 6.1517 | \n",
"
\n",
" \n",
" Skewness | \n",
" 0.91772 | \n",
"
\n",
" \n",
" Sum | \n",
" 1684029 | \n",
"
\n",
" \n",
" Variance | \n",
" 61.436 | \n",
"
\n",
" \n",
" Memory size | \n",
" 371.7 KiB | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 32 | \n",
" 3018 | \n",
" 6.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 31 | \n",
" 2989 | \n",
" 6.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 30 | \n",
" 2988 | \n",
" 6.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 33 | \n",
" 2809 | \n",
" 5.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 34 | \n",
" 2708 | \n",
" 5.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 29 | \n",
" 2633 | \n",
" 5.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 35 | \n",
" 2428 | \n",
" 5.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 28 | \n",
" 2344 | \n",
" 4.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 36 | \n",
" 2240 | \n",
" 4.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 27 | \n",
" 2112 | \n",
" 4.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Other values (31) | \n",
" 21294 | \n",
" 44.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Minimum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 20 | \n",
" 101 | \n",
" 0.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 21 | \n",
" 86 | \n",
" 0.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 22 | \n",
" 204 | \n",
" 0.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 23 | \n",
" 344 | \n",
" 0.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 24 | \n",
" 671 | \n",
" 1.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
Maximum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 56 | \n",
" 262 | \n",
" 0.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 57 | \n",
" 236 | \n",
" 0.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 58 | \n",
" 212 | \n",
" 0.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 59 | \n",
" 207 | \n",
" 0.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 60 | \n",
" 217 | \n",
" 0.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
avg_training_score
\n",
" Numeric\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 61 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.1% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
" \n",
" Infinite (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Infinite (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"\n",
" \n",
" Mean | \n",
" 63.817 | \n",
"
\n",
" \n",
" Minimum | \n",
" 39 | \n",
"
\n",
" \n",
" Maximum | \n",
" 99 | \n",
"
\n",
" \n",
" Zeros (%) | \n",
" 0.0% | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
Quantile statistics
\n",
"
\n",
" \n",
" Minimum | \n",
" 39 | \n",
"
\n",
" \n",
" 5-th percentile | \n",
" 47 | \n",
"
\n",
" \n",
" Q1 | \n",
" 52 | \n",
"
\n",
" \n",
" Median | \n",
" 61 | \n",
"
\n",
" \n",
" Q3 | \n",
" 77 | \n",
"
\n",
" \n",
" 95-th percentile | \n",
" 86 | \n",
"
\n",
" \n",
" Maximum | \n",
" 99 | \n",
"
\n",
" \n",
" Range | \n",
" 60 | \n",
"
\n",
" \n",
" Interquartile range | \n",
" 25 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Descriptive statistics
\n",
"
\n",
" \n",
" Standard deviation | \n",
" 13.444 | \n",
"
\n",
" \n",
" Coef of variation | \n",
" 0.21067 | \n",
"
\n",
" \n",
" Kurtosis | \n",
" -1.0721 | \n",
"
\n",
" \n",
" Mean | \n",
" 63.817 | \n",
"
\n",
" \n",
" MAD | \n",
" 11.643 | \n",
"
\n",
" \n",
" Skewness | \n",
" 0.40947 | \n",
"
\n",
" \n",
" Sum | \n",
" 3035325 | \n",
"
\n",
" \n",
" Variance | \n",
" 180.75 | \n",
"
\n",
" \n",
" Memory size | \n",
" 371.7 KiB | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 50 | \n",
" 2125 | \n",
" 4.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 49 | \n",
" 2090 | \n",
" 4.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 48 | \n",
" 1947 | \n",
" 4.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 51 | \n",
" 1878 | \n",
" 3.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 60 | \n",
" 1811 | \n",
" 3.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 59 | \n",
" 1720 | \n",
" 3.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 58 | \n",
" 1613 | \n",
" 3.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 61 | \n",
" 1575 | \n",
" 3.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 52 | \n",
" 1531 | \n",
" 3.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 47 | \n",
" 1458 | \n",
" 3.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Other values (51) | \n",
" 29815 | \n",
" 62.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Minimum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 39 | \n",
" 2 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 40 | \n",
" 5 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 41 | \n",
" 26 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 42 | \n",
" 62 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 43 | \n",
" 174 | \n",
" 0.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
Maximum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 95 | \n",
" 45 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 96 | \n",
" 48 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 97 | \n",
" 48 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 98 | \n",
" 37 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 99 | \n",
" 35 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
awards_won?
\n",
" Boolean\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 2 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Mean | \n",
" 0.026659 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" 0 | \n",
" \n",
" \n",
" 46295\n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" \n",
" \n",
" \n",
" \n",
" 1268\n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0 | \n",
" 46295 | \n",
" 97.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" 1268 | \n",
" 2.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
department
\n",
" Categorical\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 9 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Sales & Marketing | \n",
" \n",
" \n",
" 13818\n",
" \n",
" \n",
" | \n",
"
\n",
" Operations | \n",
" \n",
" \n",
" 9746\n",
" \n",
" \n",
" | \n",
"
\n",
" Procurement | \n",
" \n",
" \n",
" 6424\n",
" \n",
" \n",
" | \n",
"
\n",
" Other values (6) | \n",
" \n",
" \n",
" 17575\n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" Sales & Marketing | \n",
" 13818 | \n",
" 29.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Operations | \n",
" 9746 | \n",
" 20.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Procurement | \n",
" 6424 | \n",
" 13.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Technology | \n",
" 6319 | \n",
" 13.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Analytics | \n",
" 4741 | \n",
" 10.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Finance | \n",
" 2344 | \n",
" 4.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" HR | \n",
" 2233 | \n",
" 4.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" R&D | \n",
" 980 | \n",
" 2.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Legal | \n",
" 958 | \n",
" 2.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
education
\n",
" Categorical\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 4 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 4.6% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 2189 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Bachelor's | \n",
" \n",
" \n",
" 30544\n",
" \n",
" \n",
" | \n",
"
\n",
" Master's & above | \n",
" \n",
" \n",
" 14098\n",
" \n",
" \n",
" | \n",
"
\n",
" Below Secondary | \n",
" \n",
" \n",
" \n",
" \n",
" 732\n",
" | \n",
"
\n",
" (Missing) | \n",
" \n",
" \n",
" \n",
" \n",
" 2189\n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" Bachelor's | \n",
" 30544 | \n",
" 64.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Master's & above | \n",
" 14098 | \n",
" 29.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Below Secondary | \n",
" 732 | \n",
" 1.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
" (Missing) | \n",
" 2189 | \n",
" 4.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
index
\n",
" Numeric\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 47563 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 100.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
" \n",
" Infinite (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Infinite (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"\n",
" \n",
" Mean | \n",
" 26265 | \n",
"
\n",
" \n",
" Minimum | \n",
" 0 | \n",
"
\n",
" \n",
" Maximum | \n",
" 54807 | \n",
"
\n",
" \n",
" Zeros (%) | \n",
" 0.0% | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
Quantile statistics
\n",
"
\n",
" \n",
" Minimum | \n",
" 0 | \n",
"
\n",
" \n",
" 5-th percentile | \n",
" 2399.1 | \n",
"
\n",
" \n",
" Q1 | \n",
" 12392 | \n",
"
\n",
" \n",
" Median | \n",
" 25683 | \n",
"
\n",
" \n",
" Q3 | \n",
" 39846 | \n",
"
\n",
" \n",
" 95-th percentile | \n",
" 51769 | \n",
"
\n",
" \n",
" Maximum | \n",
" 54807 | \n",
"
\n",
" \n",
" Range | \n",
" 54807 | \n",
"
\n",
" \n",
" Interquartile range | \n",
" 27454 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Descriptive statistics
\n",
"
\n",
" \n",
" Standard deviation | \n",
" 15854 | \n",
"
\n",
" \n",
" Coef of variation | \n",
" 0.60362 | \n",
"
\n",
" \n",
" Kurtosis | \n",
" -1.1965 | \n",
"
\n",
" \n",
" Mean | \n",
" 26265 | \n",
"
\n",
" \n",
" MAD | \n",
" 13734 | \n",
"
\n",
" \n",
" Skewness | \n",
" 0.086918 | \n",
"
\n",
" \n",
" Sum | \n",
" 1249231318 | \n",
"
\n",
" \n",
" Variance | \n",
" 251350000 | \n",
"
\n",
" \n",
" Memory size | \n",
" 371.7 KiB | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 2047 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 36123 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 29988 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 19747 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 17698 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 23841 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 21792 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 44319 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 42270 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 48413 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Other values (47553) | \n",
" 47553 | \n",
" 100.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Minimum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 2 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 3 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 4 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
Maximum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 54803 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 54804 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 54805 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 54806 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 54807 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
is_promoted
\n",
" Boolean\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 2 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Mean | \n",
" 0.096188 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" 0 | \n",
" \n",
" \n",
" 42988\n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" \n",
" \n",
" \n",
" \n",
" 4575\n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0 | \n",
" 42988 | \n",
" 90.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" 4575 | \n",
" 9.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
length_of_service
\n",
" Numeric\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 35 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.1% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
" \n",
" Infinite (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Infinite (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"\n",
" \n",
" Mean | \n",
" 6.1253 | \n",
"
\n",
" \n",
" Minimum | \n",
" 1 | \n",
"
\n",
" \n",
" Maximum | \n",
" 37 | \n",
"
\n",
" \n",
" Zeros (%) | \n",
" 0.0% | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
Quantile statistics
\n",
"
\n",
" \n",
" Minimum | \n",
" 1 | \n",
"
\n",
" \n",
" 5-th percentile | \n",
" 1 | \n",
"
\n",
" \n",
" Q1 | \n",
" 3 | \n",
"
\n",
" \n",
" Median | \n",
" 5 | \n",
"
\n",
" \n",
" Q3 | \n",
" 8 | \n",
"
\n",
" \n",
" 95-th percentile | \n",
" 15 | \n",
"
\n",
" \n",
" Maximum | \n",
" 37 | \n",
"
\n",
" \n",
" Range | \n",
" 36 | \n",
"
\n",
" \n",
" Interquartile range | \n",
" 5 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Descriptive statistics
\n",
"
\n",
" \n",
" Standard deviation | \n",
" 4.3794 | \n",
"
\n",
" \n",
" Coef of variation | \n",
" 0.71497 | \n",
"
\n",
" \n",
" Kurtosis | \n",
" 4.1199 | \n",
"
\n",
" \n",
" Mean | \n",
" 6.1253 | \n",
"
\n",
" \n",
" MAD | \n",
" 3.2216 | \n",
"
\n",
" \n",
" Skewness | \n",
" 1.7064 | \n",
"
\n",
" \n",
" Sum | \n",
" 291337 | \n",
"
\n",
" \n",
" Variance | \n",
" 19.179 | \n",
"
\n",
" \n",
" Memory size | \n",
" 371.7 KiB | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 3 | \n",
" 6102 | \n",
" 12.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 4 | \n",
" 5901 | \n",
" 12.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 2 | \n",
" 5688 | \n",
" 12.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 5 | \n",
" 5096 | \n",
" 10.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 7 | \n",
" 4876 | \n",
" 10.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 6 | \n",
" 4186 | \n",
" 8.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" 2981 | \n",
" 6.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 8 | \n",
" 2629 | \n",
" 5.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 9 | \n",
" 2365 | \n",
" 5.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 10 | \n",
" 1990 | \n",
" 4.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Other values (25) | \n",
" 5749 | \n",
" 12.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Minimum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 1 | \n",
" 2981 | \n",
" 6.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 2 | \n",
" 5688 | \n",
" 12.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 3 | \n",
" 6102 | \n",
" 12.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 4 | \n",
" 5901 | \n",
" 12.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 5 | \n",
" 5096 | \n",
" 10.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
Maximum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 31 | \n",
" 20 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 32 | \n",
" 10 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 33 | \n",
" 9 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 34 | \n",
" 4 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 37 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
no_of_trainings
\n",
" Numeric\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 10 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
" \n",
" Infinite (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Infinite (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"\n",
" \n",
" Mean | \n",
" 1.2785 | \n",
"
\n",
" \n",
" Minimum | \n",
" 1 | \n",
"
\n",
" \n",
" Maximum | \n",
" 10 | \n",
"
\n",
" \n",
" Zeros (%) | \n",
" 0.0% | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
Quantile statistics
\n",
"
\n",
" \n",
" Minimum | \n",
" 1 | \n",
"
\n",
" \n",
" 5-th percentile | \n",
" 1 | \n",
"
\n",
" \n",
" Q1 | \n",
" 1 | \n",
"
\n",
" \n",
" Median | \n",
" 1 | \n",
"
\n",
" \n",
" Q3 | \n",
" 1 | \n",
"
\n",
" \n",
" 95-th percentile | \n",
" 3 | \n",
"
\n",
" \n",
" Maximum | \n",
" 10 | \n",
"
\n",
" \n",
" Range | \n",
" 9 | \n",
"
\n",
" \n",
" Interquartile range | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Descriptive statistics
\n",
"
\n",
" \n",
" Standard deviation | \n",
" 0.63886 | \n",
"
\n",
" \n",
" Coef of variation | \n",
" 0.49968 | \n",
"
\n",
" \n",
" Kurtosis | \n",
" 17.033 | \n",
"
\n",
" \n",
" Mean | \n",
" 1.2785 | \n",
"
\n",
" \n",
" MAD | \n",
" 0.44152 | \n",
"
\n",
" \n",
" Skewness | \n",
" 3.2815 | \n",
"
\n",
" \n",
" Sum | \n",
" 60811 | \n",
"
\n",
" \n",
" Variance | \n",
" 0.40814 | \n",
"
\n",
" \n",
" Memory size | \n",
" 371.7 KiB | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 1 | \n",
" 37697 | \n",
" 79.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 2 | \n",
" 7469 | \n",
" 15.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 3 | \n",
" 1737 | \n",
" 3.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 4 | \n",
" 463 | \n",
" 1.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 5 | \n",
" 126 | \n",
" 0.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 6 | \n",
" 44 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 7 | \n",
" 12 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 10 | \n",
" 5 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 9 | \n",
" 5 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 8 | \n",
" 5 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Minimum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 1 | \n",
" 37697 | \n",
" 79.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 2 | \n",
" 7469 | \n",
" 15.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 3 | \n",
" 1737 | \n",
" 3.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 4 | \n",
" 463 | \n",
" 1.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 5 | \n",
" 126 | \n",
" 0.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
Maximum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 6 | \n",
" 44 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 7 | \n",
" 12 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 8 | \n",
" 5 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 9 | \n",
" 5 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 10 | \n",
" 5 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
previous_year_rating
\n",
" Numeric\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 6 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
" \n",
" Infinite (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Infinite (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"\n",
" \n",
" Mean | \n",
" 3.1554 | \n",
"
\n",
" \n",
" Minimum | \n",
" 0 | \n",
"
\n",
" \n",
" Maximum | \n",
" 5 | \n",
"
\n",
" \n",
" Zeros (%) | \n",
" 5.4% | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
Quantile statistics
\n",
"
\n",
" \n",
" Minimum | \n",
" 0 | \n",
"
\n",
" \n",
" 5-th percentile | \n",
" 0 | \n",
"
\n",
" \n",
" Q1 | \n",
" 2 | \n",
"
\n",
" \n",
" Median | \n",
" 3 | \n",
"
\n",
" \n",
" Q3 | \n",
" 4 | \n",
"
\n",
" \n",
" 95-th percentile | \n",
" 5 | \n",
"
\n",
" \n",
" Maximum | \n",
" 5 | \n",
"
\n",
" \n",
" Range | \n",
" 5 | \n",
"
\n",
" \n",
" Interquartile range | \n",
" 2 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Descriptive statistics
\n",
"
\n",
" \n",
" Standard deviation | \n",
" 1.4435 | \n",
"
\n",
" \n",
" Coef of variation | \n",
" 0.45745 | \n",
"
\n",
" \n",
" Kurtosis | \n",
" -0.54307 | \n",
"
\n",
" \n",
" Mean | \n",
" 3.1554 | \n",
"
\n",
" \n",
" MAD | \n",
" 1.1364 | \n",
"
\n",
" \n",
" Skewness | \n",
" -0.49326 | \n",
"
\n",
" \n",
" Sum | \n",
" 150080 | \n",
"
\n",
" \n",
" Variance | \n",
" 2.0836 | \n",
"
\n",
" \n",
" Memory size | \n",
" 371.7 KiB | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 3.0 | \n",
" 16026 | \n",
" 33.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 5.0 | \n",
" 10534 | \n",
" 22.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 4.0 | \n",
" 8993 | \n",
" 18.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1.0 | \n",
" 5522 | \n",
" 11.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 2.0 | \n",
" 3920 | \n",
" 8.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0 | \n",
" 2568 | \n",
" 5.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Minimum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.0 | \n",
" 2568 | \n",
" 5.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1.0 | \n",
" 5522 | \n",
" 11.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 2.0 | \n",
" 3920 | \n",
" 8.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 3.0 | \n",
" 16026 | \n",
" 33.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 4.0 | \n",
" 8993 | \n",
" 18.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
Maximum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 1.0 | \n",
" 5522 | \n",
" 11.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 2.0 | \n",
" 3920 | \n",
" 8.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 3.0 | \n",
" 16026 | \n",
" 33.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 4.0 | \n",
" 8993 | \n",
" 18.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 5.0 | \n",
" 10534 | \n",
" 22.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Correlations
\n",
" \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Sample
\n",
" \n",
"
\n",
"
\n",
"
\n",
" \n",
" \n",
" | \n",
" department | \n",
" education | \n",
" no_of_trainings | \n",
" age | \n",
" previous_year_rating | \n",
" length_of_service | \n",
" KPIs_met >80% | \n",
" awards_won? | \n",
" avg_training_score | \n",
" is_promoted | \n",
"
\n",
" \n",
" \n",
" \n",
" 0 | \n",
" Sales & Marketing | \n",
" Master's & above | \n",
" 1 | \n",
" 35 | \n",
" 5.0 | \n",
" 8 | \n",
" 1 | \n",
" 0 | \n",
" 49 | \n",
" 0 | \n",
"
\n",
" \n",
" 1 | \n",
" Operations | \n",
" Bachelor's | \n",
" 1 | \n",
" 30 | \n",
" 5.0 | \n",
" 4 | \n",
" 0 | \n",
" 0 | \n",
" 60 | \n",
" 0 | \n",
"
\n",
" \n",
" 2 | \n",
" Sales & Marketing | \n",
" Bachelor's | \n",
" 1 | \n",
" 34 | \n",
" 3.0 | \n",
" 7 | \n",
" 0 | \n",
" 0 | \n",
" 50 | \n",
" 0 | \n",
"
\n",
" \n",
" 3 | \n",
" Sales & Marketing | \n",
" Bachelor's | \n",
" 2 | \n",
" 39 | \n",
" 1.0 | \n",
" 10 | \n",
" 0 | \n",
" 0 | \n",
" 50 | \n",
" 0 | \n",
"
\n",
" \n",
" 4 | \n",
" Technology | \n",
" Bachelor's | \n",
" 1 | \n",
" 45 | \n",
" 3.0 | \n",
" 2 | \n",
" 0 | \n",
" 0 | \n",
" 73 | \n",
" 0 | \n",
"
\n",
" \n",
"
\n",
"
\n",
"
\n",
"
"
],
"text/plain": [
""
]
},
"execution_count": 201,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"pandas_profiling.ProfileReport(df)"
]
},
{
"cell_type": "code",
"execution_count": 202,
"metadata": {},
"outputs": [],
"source": [
"#function handles character data by converting them into numerical data\n",
"def handle_non_numerical_data(df):\n",
" columns = df.columns.values#taking all the columns of the dataset into variable \n",
"\n",
" for column in columns:\n",
" text_digit_vals = {}#contains all the unique values and the number with which they will be replaced\n",
" def convert_to_int(val):\n",
" return text_digit_vals[val]\n",
"\n",
" if df[column].dtype != np.int64 and df[column].dtype != np.float64:#if the column datatype is not int or float then conversion will start\n",
" column_contents = df[column].values.tolist()\n",
" unique_elements = set(column_contents)\n",
" x = 0\n",
" for unique in unique_elements:\n",
" if unique not in text_digit_vals:\n",
" text_digit_vals[unique] = x\n",
" x+=1\n",
"\n",
" df[column] = list(map(convert_to_int, df[column]))\n",
"\n",
" return df\n",
"\n",
"df = handle_non_numerical_data(df)"
]
},
{
"cell_type": "code",
"execution_count": 203,
"metadata": {},
"outputs": [],
"source": [
"df.drop_duplicates(keep='first', inplace=True)"
]
},
{
"cell_type": "code",
"execution_count": 204,
"metadata": {
"scrolled": false
},
"outputs": [
{
"data": {
"text/html": [
"\n",
"\n",
"\n",
"\n",
"\n",
"
\n",
"
Overview
\n",
" \n",
"
\n",
"
\n",
"
Dataset info
\n",
"
\n",
" \n",
" \n",
" Number of variables | \n",
" 11 | \n",
"
\n",
" \n",
" Number of observations | \n",
" 47563 | \n",
"
\n",
" \n",
" Total Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Total size in memory | \n",
" 4.0 MiB | \n",
"
\n",
" \n",
" Average record size in memory | \n",
" 88.0 B | \n",
"
\n",
" \n",
"
\n",
"
\n",
"
\n",
"
Variables types
\n",
"
\n",
" \n",
" \n",
" Numeric | \n",
" 8 | \n",
"
\n",
" \n",
" Categorical | \n",
" 0 | \n",
"
\n",
" \n",
" Boolean | \n",
" 3 | \n",
"
\n",
" \n",
" Date | \n",
" 0 | \n",
"
\n",
" \n",
" Text (Unique) | \n",
" 0 | \n",
"
\n",
" \n",
" Rejected | \n",
" 0 | \n",
"
\n",
" \n",
" Unsupported | \n",
" 0 | \n",
"
\n",
" \n",
"
\n",
"
\n",
"
\n",
" \n",
"
Warnings
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Variables
\n",
" \n",
"
\n",
"
\n",
"
80%\">KPIs_met >80%
\n",
" Boolean\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 2 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Mean | \n",
" 0.36724 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" 0 | \n",
" \n",
" \n",
" 30096\n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" \n",
" \n",
" 17467\n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0 | \n",
" 30096 | \n",
" 63.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" 17467 | \n",
" 36.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
age
\n",
" Numeric\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 41 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.1% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
" \n",
" Infinite (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Infinite (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"\n",
" \n",
" Mean | \n",
" 35.406 | \n",
"
\n",
" \n",
" Minimum | \n",
" 20 | \n",
"
\n",
" \n",
" Maximum | \n",
" 60 | \n",
"
\n",
" \n",
" Zeros (%) | \n",
" 0.0% | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
Quantile statistics
\n",
"
\n",
" \n",
" Minimum | \n",
" 20 | \n",
"
\n",
" \n",
" 5-th percentile | \n",
" 25 | \n",
"
\n",
" \n",
" Q1 | \n",
" 30 | \n",
"
\n",
" \n",
" Median | \n",
" 34 | \n",
"
\n",
" \n",
" Q3 | \n",
" 40 | \n",
"
\n",
" \n",
" 95-th percentile | \n",
" 52 | \n",
"
\n",
" \n",
" Maximum | \n",
" 60 | \n",
"
\n",
" \n",
" Range | \n",
" 40 | \n",
"
\n",
" \n",
" Interquartile range | \n",
" 10 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Descriptive statistics
\n",
"
\n",
" \n",
" Standard deviation | \n",
" 7.8381 | \n",
"
\n",
" \n",
" Coef of variation | \n",
" 0.22138 | \n",
"
\n",
" \n",
" Kurtosis | \n",
" 0.5402 | \n",
"
\n",
" \n",
" Mean | \n",
" 35.406 | \n",
"
\n",
" \n",
" MAD | \n",
" 6.1517 | \n",
"
\n",
" \n",
" Skewness | \n",
" 0.91772 | \n",
"
\n",
" \n",
" Sum | \n",
" 1684029 | \n",
"
\n",
" \n",
" Variance | \n",
" 61.436 | \n",
"
\n",
" \n",
" Memory size | \n",
" 371.7 KiB | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 32 | \n",
" 3018 | \n",
" 6.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 31 | \n",
" 2989 | \n",
" 6.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 30 | \n",
" 2988 | \n",
" 6.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 33 | \n",
" 2809 | \n",
" 5.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 34 | \n",
" 2708 | \n",
" 5.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 29 | \n",
" 2633 | \n",
" 5.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 35 | \n",
" 2428 | \n",
" 5.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 28 | \n",
" 2344 | \n",
" 4.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 36 | \n",
" 2240 | \n",
" 4.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 27 | \n",
" 2112 | \n",
" 4.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Other values (31) | \n",
" 21294 | \n",
" 44.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Minimum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 20 | \n",
" 101 | \n",
" 0.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 21 | \n",
" 86 | \n",
" 0.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 22 | \n",
" 204 | \n",
" 0.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 23 | \n",
" 344 | \n",
" 0.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 24 | \n",
" 671 | \n",
" 1.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
Maximum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 56 | \n",
" 262 | \n",
" 0.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 57 | \n",
" 236 | \n",
" 0.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 58 | \n",
" 212 | \n",
" 0.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 59 | \n",
" 207 | \n",
" 0.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 60 | \n",
" 217 | \n",
" 0.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
avg_training_score
\n",
" Numeric\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 61 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.1% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
" \n",
" Infinite (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Infinite (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"\n",
" \n",
" Mean | \n",
" 63.817 | \n",
"
\n",
" \n",
" Minimum | \n",
" 39 | \n",
"
\n",
" \n",
" Maximum | \n",
" 99 | \n",
"
\n",
" \n",
" Zeros (%) | \n",
" 0.0% | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
Quantile statistics
\n",
"
\n",
" \n",
" Minimum | \n",
" 39 | \n",
"
\n",
" \n",
" 5-th percentile | \n",
" 47 | \n",
"
\n",
" \n",
" Q1 | \n",
" 52 | \n",
"
\n",
" \n",
" Median | \n",
" 61 | \n",
"
\n",
" \n",
" Q3 | \n",
" 77 | \n",
"
\n",
" \n",
" 95-th percentile | \n",
" 86 | \n",
"
\n",
" \n",
" Maximum | \n",
" 99 | \n",
"
\n",
" \n",
" Range | \n",
" 60 | \n",
"
\n",
" \n",
" Interquartile range | \n",
" 25 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Descriptive statistics
\n",
"
\n",
" \n",
" Standard deviation | \n",
" 13.444 | \n",
"
\n",
" \n",
" Coef of variation | \n",
" 0.21067 | \n",
"
\n",
" \n",
" Kurtosis | \n",
" -1.0721 | \n",
"
\n",
" \n",
" Mean | \n",
" 63.817 | \n",
"
\n",
" \n",
" MAD | \n",
" 11.643 | \n",
"
\n",
" \n",
" Skewness | \n",
" 0.40947 | \n",
"
\n",
" \n",
" Sum | \n",
" 3035325 | \n",
"
\n",
" \n",
" Variance | \n",
" 180.75 | \n",
"
\n",
" \n",
" Memory size | \n",
" 371.7 KiB | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 50 | \n",
" 2125 | \n",
" 4.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 49 | \n",
" 2090 | \n",
" 4.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 48 | \n",
" 1947 | \n",
" 4.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 51 | \n",
" 1878 | \n",
" 3.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 60 | \n",
" 1811 | \n",
" 3.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 59 | \n",
" 1720 | \n",
" 3.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 58 | \n",
" 1613 | \n",
" 3.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 61 | \n",
" 1575 | \n",
" 3.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 52 | \n",
" 1531 | \n",
" 3.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 47 | \n",
" 1458 | \n",
" 3.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Other values (51) | \n",
" 29815 | \n",
" 62.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Minimum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 39 | \n",
" 2 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 40 | \n",
" 5 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 41 | \n",
" 26 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 42 | \n",
" 62 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 43 | \n",
" 174 | \n",
" 0.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
Maximum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 95 | \n",
" 45 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 96 | \n",
" 48 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 97 | \n",
" 48 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 98 | \n",
" 37 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 99 | \n",
" 35 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
awards_won?
\n",
" Boolean\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 2 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Mean | \n",
" 0.026659 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" 0 | \n",
" \n",
" \n",
" 46295\n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" \n",
" \n",
" \n",
" \n",
" 1268\n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0 | \n",
" 46295 | \n",
" 97.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" 1268 | \n",
" 2.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
department
\n",
" Numeric\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 9 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
" \n",
" Infinite (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Infinite (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"\n",
" \n",
" Mean | \n",
" 3.0912 | \n",
"
\n",
" \n",
" Minimum | \n",
" 0 | \n",
"
\n",
" \n",
" Maximum | \n",
" 8 | \n",
"
\n",
" \n",
" Zeros (%) | \n",
" 20.5% | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
Quantile statistics
\n",
"
\n",
" \n",
" Minimum | \n",
" 0 | \n",
"
\n",
" \n",
" 5-th percentile | \n",
" 0 | \n",
"
\n",
" \n",
" Q1 | \n",
" 1 | \n",
"
\n",
" \n",
" Median | \n",
" 3 | \n",
"
\n",
" \n",
" Q3 | \n",
" 6 | \n",
"
\n",
" \n",
" 95-th percentile | \n",
" 7 | \n",
"
\n",
" \n",
" Maximum | \n",
" 8 | \n",
"
\n",
" \n",
" Range | \n",
" 8 | \n",
"
\n",
" \n",
" Interquartile range | \n",
" 5 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Descriptive statistics
\n",
"
\n",
" \n",
" Standard deviation | \n",
" 2.4393 | \n",
"
\n",
" \n",
" Coef of variation | \n",
" 0.7891 | \n",
"
\n",
" \n",
" Kurtosis | \n",
" -1.1115 | \n",
"
\n",
" \n",
" Mean | \n",
" 3.0912 | \n",
"
\n",
" \n",
" MAD | \n",
" 1.9831 | \n",
"
\n",
" \n",
" Skewness | \n",
" 0.32544 | \n",
"
\n",
" \n",
" Sum | \n",
" 147029 | \n",
"
\n",
" \n",
" Variance | \n",
" 5.9501 | \n",
"
\n",
" \n",
" Memory size | \n",
" 371.7 KiB | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 3 | \n",
" 13818 | \n",
" 29.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0 | \n",
" 9746 | \n",
" 20.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 6 | \n",
" 6424 | \n",
" 13.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" 6319 | \n",
" 13.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 7 | \n",
" 4741 | \n",
" 10.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 2 | \n",
" 2344 | \n",
" 4.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 5 | \n",
" 2233 | \n",
" 4.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 8 | \n",
" 980 | \n",
" 2.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 4 | \n",
" 958 | \n",
" 2.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Minimum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0 | \n",
" 9746 | \n",
" 20.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" 6319 | \n",
" 13.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 2 | \n",
" 2344 | \n",
" 4.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 3 | \n",
" 13818 | \n",
" 29.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 4 | \n",
" 958 | \n",
" 2.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
Maximum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 4 | \n",
" 958 | \n",
" 2.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 5 | \n",
" 2233 | \n",
" 4.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 6 | \n",
" 6424 | \n",
" 13.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 7 | \n",
" 4741 | \n",
" 10.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 8 | \n",
" 980 | \n",
" 2.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
education
\n",
" Numeric\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 4 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
" \n",
" Infinite (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Infinite (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"\n",
" \n",
" Mean | \n",
" 2.189 | \n",
"
\n",
" \n",
" Minimum | \n",
" 0 | \n",
"
\n",
" \n",
" Maximum | \n",
" 3 | \n",
"
\n",
" \n",
" Zeros (%) | \n",
" 4.6% | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
Quantile statistics
\n",
"
\n",
" \n",
" Minimum | \n",
" 0 | \n",
"
\n",
" \n",
" 5-th percentile | \n",
" 1 | \n",
"
\n",
" \n",
" Q1 | \n",
" 2 | \n",
"
\n",
" \n",
" Median | \n",
" 2 | \n",
"
\n",
" \n",
" Q3 | \n",
" 3 | \n",
"
\n",
" \n",
" 95-th percentile | \n",
" 3 | \n",
"
\n",
" \n",
" Maximum | \n",
" 3 | \n",
"
\n",
" \n",
" Range | \n",
" 3 | \n",
"
\n",
" \n",
" Interquartile range | \n",
" 1 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Descriptive statistics
\n",
"
\n",
" \n",
" Standard deviation | \n",
" 0.67837 | \n",
"
\n",
" \n",
" Coef of variation | \n",
" 0.3099 | \n",
"
\n",
" \n",
" Kurtosis | \n",
" 2.7449 | \n",
"
\n",
" \n",
" Mean | \n",
" 2.189 | \n",
"
\n",
" \n",
" MAD | \n",
" 0.48079 | \n",
"
\n",
" \n",
" Skewness | \n",
" -1.1366 | \n",
"
\n",
" \n",
" Sum | \n",
" 104114 | \n",
"
\n",
" \n",
" Variance | \n",
" 0.46019 | \n",
"
\n",
" \n",
" Memory size | \n",
" 371.7 KiB | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 2 | \n",
" 30544 | \n",
" 64.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 3 | \n",
" 14098 | \n",
" 29.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0 | \n",
" 2189 | \n",
" 4.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" 732 | \n",
" 1.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Minimum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0 | \n",
" 2189 | \n",
" 4.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" 732 | \n",
" 1.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 2 | \n",
" 30544 | \n",
" 64.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 3 | \n",
" 14098 | \n",
" 29.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
Maximum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0 | \n",
" 2189 | \n",
" 4.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" 732 | \n",
" 1.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 2 | \n",
" 30544 | \n",
" 64.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 3 | \n",
" 14098 | \n",
" 29.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
index
\n",
" Numeric\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 47563 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 100.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
" \n",
" Infinite (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Infinite (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"\n",
" \n",
" Mean | \n",
" 26265 | \n",
"
\n",
" \n",
" Minimum | \n",
" 0 | \n",
"
\n",
" \n",
" Maximum | \n",
" 54807 | \n",
"
\n",
" \n",
" Zeros (%) | \n",
" 0.0% | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
Quantile statistics
\n",
"
\n",
" \n",
" Minimum | \n",
" 0 | \n",
"
\n",
" \n",
" 5-th percentile | \n",
" 2399.1 | \n",
"
\n",
" \n",
" Q1 | \n",
" 12392 | \n",
"
\n",
" \n",
" Median | \n",
" 25683 | \n",
"
\n",
" \n",
" Q3 | \n",
" 39846 | \n",
"
\n",
" \n",
" 95-th percentile | \n",
" 51769 | \n",
"
\n",
" \n",
" Maximum | \n",
" 54807 | \n",
"
\n",
" \n",
" Range | \n",
" 54807 | \n",
"
\n",
" \n",
" Interquartile range | \n",
" 27454 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Descriptive statistics
\n",
"
\n",
" \n",
" Standard deviation | \n",
" 15854 | \n",
"
\n",
" \n",
" Coef of variation | \n",
" 0.60362 | \n",
"
\n",
" \n",
" Kurtosis | \n",
" -1.1965 | \n",
"
\n",
" \n",
" Mean | \n",
" 26265 | \n",
"
\n",
" \n",
" MAD | \n",
" 13734 | \n",
"
\n",
" \n",
" Skewness | \n",
" 0.086918 | \n",
"
\n",
" \n",
" Sum | \n",
" 1249231318 | \n",
"
\n",
" \n",
" Variance | \n",
" 251350000 | \n",
"
\n",
" \n",
" Memory size | \n",
" 371.7 KiB | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 2047 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 36123 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 29988 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 19747 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 17698 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 23841 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 21792 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 44319 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 42270 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 48413 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Other values (47553) | \n",
" 47553 | \n",
" 100.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Minimum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 2 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 3 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 4 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
Maximum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 54803 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 54804 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 54805 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 54806 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 54807 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
is_promoted
\n",
" Boolean\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 2 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Mean | \n",
" 0.096188 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" 0 | \n",
" \n",
" \n",
" 42988\n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" \n",
" \n",
" \n",
" \n",
" 4575\n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0 | \n",
" 42988 | \n",
" 90.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" 4575 | \n",
" 9.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
length_of_service
\n",
" Numeric\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 35 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.1% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
" \n",
" Infinite (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Infinite (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"\n",
" \n",
" Mean | \n",
" 6.1253 | \n",
"
\n",
" \n",
" Minimum | \n",
" 1 | \n",
"
\n",
" \n",
" Maximum | \n",
" 37 | \n",
"
\n",
" \n",
" Zeros (%) | \n",
" 0.0% | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
Quantile statistics
\n",
"
\n",
" \n",
" Minimum | \n",
" 1 | \n",
"
\n",
" \n",
" 5-th percentile | \n",
" 1 | \n",
"
\n",
" \n",
" Q1 | \n",
" 3 | \n",
"
\n",
" \n",
" Median | \n",
" 5 | \n",
"
\n",
" \n",
" Q3 | \n",
" 8 | \n",
"
\n",
" \n",
" 95-th percentile | \n",
" 15 | \n",
"
\n",
" \n",
" Maximum | \n",
" 37 | \n",
"
\n",
" \n",
" Range | \n",
" 36 | \n",
"
\n",
" \n",
" Interquartile range | \n",
" 5 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Descriptive statistics
\n",
"
\n",
" \n",
" Standard deviation | \n",
" 4.3794 | \n",
"
\n",
" \n",
" Coef of variation | \n",
" 0.71497 | \n",
"
\n",
" \n",
" Kurtosis | \n",
" 4.1199 | \n",
"
\n",
" \n",
" Mean | \n",
" 6.1253 | \n",
"
\n",
" \n",
" MAD | \n",
" 3.2216 | \n",
"
\n",
" \n",
" Skewness | \n",
" 1.7064 | \n",
"
\n",
" \n",
" Sum | \n",
" 291337 | \n",
"
\n",
" \n",
" Variance | \n",
" 19.179 | \n",
"
\n",
" \n",
" Memory size | \n",
" 371.7 KiB | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 3 | \n",
" 6102 | \n",
" 12.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 4 | \n",
" 5901 | \n",
" 12.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 2 | \n",
" 5688 | \n",
" 12.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 5 | \n",
" 5096 | \n",
" 10.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 7 | \n",
" 4876 | \n",
" 10.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 6 | \n",
" 4186 | \n",
" 8.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" 2981 | \n",
" 6.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 8 | \n",
" 2629 | \n",
" 5.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 9 | \n",
" 2365 | \n",
" 5.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 10 | \n",
" 1990 | \n",
" 4.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Other values (25) | \n",
" 5749 | \n",
" 12.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Minimum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 1 | \n",
" 2981 | \n",
" 6.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 2 | \n",
" 5688 | \n",
" 12.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 3 | \n",
" 6102 | \n",
" 12.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 4 | \n",
" 5901 | \n",
" 12.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 5 | \n",
" 5096 | \n",
" 10.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
Maximum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 31 | \n",
" 20 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 32 | \n",
" 10 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 33 | \n",
" 9 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 34 | \n",
" 4 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 37 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
no_of_trainings
\n",
" Numeric\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 10 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
" \n",
" Infinite (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Infinite (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"\n",
" \n",
" Mean | \n",
" 1.2785 | \n",
"
\n",
" \n",
" Minimum | \n",
" 1 | \n",
"
\n",
" \n",
" Maximum | \n",
" 10 | \n",
"
\n",
" \n",
" Zeros (%) | \n",
" 0.0% | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
Quantile statistics
\n",
"
\n",
" \n",
" Minimum | \n",
" 1 | \n",
"
\n",
" \n",
" 5-th percentile | \n",
" 1 | \n",
"
\n",
" \n",
" Q1 | \n",
" 1 | \n",
"
\n",
" \n",
" Median | \n",
" 1 | \n",
"
\n",
" \n",
" Q3 | \n",
" 1 | \n",
"
\n",
" \n",
" 95-th percentile | \n",
" 3 | \n",
"
\n",
" \n",
" Maximum | \n",
" 10 | \n",
"
\n",
" \n",
" Range | \n",
" 9 | \n",
"
\n",
" \n",
" Interquartile range | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Descriptive statistics
\n",
"
\n",
" \n",
" Standard deviation | \n",
" 0.63886 | \n",
"
\n",
" \n",
" Coef of variation | \n",
" 0.49968 | \n",
"
\n",
" \n",
" Kurtosis | \n",
" 17.033 | \n",
"
\n",
" \n",
" Mean | \n",
" 1.2785 | \n",
"
\n",
" \n",
" MAD | \n",
" 0.44152 | \n",
"
\n",
" \n",
" Skewness | \n",
" 3.2815 | \n",
"
\n",
" \n",
" Sum | \n",
" 60811 | \n",
"
\n",
" \n",
" Variance | \n",
" 0.40814 | \n",
"
\n",
" \n",
" Memory size | \n",
" 371.7 KiB | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 1 | \n",
" 37697 | \n",
" 79.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 2 | \n",
" 7469 | \n",
" 15.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 3 | \n",
" 1737 | \n",
" 3.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 4 | \n",
" 463 | \n",
" 1.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 5 | \n",
" 126 | \n",
" 0.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 6 | \n",
" 44 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 7 | \n",
" 12 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 10 | \n",
" 5 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 9 | \n",
" 5 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 8 | \n",
" 5 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Minimum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 1 | \n",
" 37697 | \n",
" 79.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 2 | \n",
" 7469 | \n",
" 15.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 3 | \n",
" 1737 | \n",
" 3.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 4 | \n",
" 463 | \n",
" 1.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 5 | \n",
" 126 | \n",
" 0.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
Maximum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 6 | \n",
" 44 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 7 | \n",
" 12 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 8 | \n",
" 5 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 9 | \n",
" 5 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 10 | \n",
" 5 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
previous_year_rating
\n",
" Numeric\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 6 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
" \n",
" Infinite (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Infinite (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"\n",
" \n",
" Mean | \n",
" 3.1554 | \n",
"
\n",
" \n",
" Minimum | \n",
" 0 | \n",
"
\n",
" \n",
" Maximum | \n",
" 5 | \n",
"
\n",
" \n",
" Zeros (%) | \n",
" 5.4% | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
Quantile statistics
\n",
"
\n",
" \n",
" Minimum | \n",
" 0 | \n",
"
\n",
" \n",
" 5-th percentile | \n",
" 0 | \n",
"
\n",
" \n",
" Q1 | \n",
" 2 | \n",
"
\n",
" \n",
" Median | \n",
" 3 | \n",
"
\n",
" \n",
" Q3 | \n",
" 4 | \n",
"
\n",
" \n",
" 95-th percentile | \n",
" 5 | \n",
"
\n",
" \n",
" Maximum | \n",
" 5 | \n",
"
\n",
" \n",
" Range | \n",
" 5 | \n",
"
\n",
" \n",
" Interquartile range | \n",
" 2 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Descriptive statistics
\n",
"
\n",
" \n",
" Standard deviation | \n",
" 1.4435 | \n",
"
\n",
" \n",
" Coef of variation | \n",
" 0.45745 | \n",
"
\n",
" \n",
" Kurtosis | \n",
" -0.54307 | \n",
"
\n",
" \n",
" Mean | \n",
" 3.1554 | \n",
"
\n",
" \n",
" MAD | \n",
" 1.1364 | \n",
"
\n",
" \n",
" Skewness | \n",
" -0.49326 | \n",
"
\n",
" \n",
" Sum | \n",
" 150080 | \n",
"
\n",
" \n",
" Variance | \n",
" 2.0836 | \n",
"
\n",
" \n",
" Memory size | \n",
" 371.7 KiB | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 3.0 | \n",
" 16026 | \n",
" 33.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 5.0 | \n",
" 10534 | \n",
" 22.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 4.0 | \n",
" 8993 | \n",
" 18.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1.0 | \n",
" 5522 | \n",
" 11.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 2.0 | \n",
" 3920 | \n",
" 8.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 0.0 | \n",
" 2568 | \n",
" 5.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Minimum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0.0 | \n",
" 2568 | \n",
" 5.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1.0 | \n",
" 5522 | \n",
" 11.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 2.0 | \n",
" 3920 | \n",
" 8.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 3.0 | \n",
" 16026 | \n",
" 33.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 4.0 | \n",
" 8993 | \n",
" 18.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
Maximum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 1.0 | \n",
" 5522 | \n",
" 11.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 2.0 | \n",
" 3920 | \n",
" 8.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 3.0 | \n",
" 16026 | \n",
" 33.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 4.0 | \n",
" 8993 | \n",
" 18.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 5.0 | \n",
" 10534 | \n",
" 22.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Correlations
\n",
" \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Sample
\n",
" \n",
"
\n",
"
\n",
"
\n",
" \n",
" \n",
" | \n",
" department | \n",
" education | \n",
" no_of_trainings | \n",
" age | \n",
" previous_year_rating | \n",
" length_of_service | \n",
" KPIs_met >80% | \n",
" awards_won? | \n",
" avg_training_score | \n",
" is_promoted | \n",
"
\n",
" \n",
" \n",
" \n",
" 0 | \n",
" 3 | \n",
" 3 | \n",
" 1 | \n",
" 35 | \n",
" 5.0 | \n",
" 8 | \n",
" 1 | \n",
" 0 | \n",
" 49 | \n",
" 0 | \n",
"
\n",
" \n",
" 1 | \n",
" 0 | \n",
" 2 | \n",
" 1 | \n",
" 30 | \n",
" 5.0 | \n",
" 4 | \n",
" 0 | \n",
" 0 | \n",
" 60 | \n",
" 0 | \n",
"
\n",
" \n",
" 2 | \n",
" 3 | \n",
" 2 | \n",
" 1 | \n",
" 34 | \n",
" 3.0 | \n",
" 7 | \n",
" 0 | \n",
" 0 | \n",
" 50 | \n",
" 0 | \n",
"
\n",
" \n",
" 3 | \n",
" 3 | \n",
" 2 | \n",
" 2 | \n",
" 39 | \n",
" 1.0 | \n",
" 10 | \n",
" 0 | \n",
" 0 | \n",
" 50 | \n",
" 0 | \n",
"
\n",
" \n",
" 4 | \n",
" 1 | \n",
" 2 | \n",
" 1 | \n",
" 45 | \n",
" 3.0 | \n",
" 2 | \n",
" 0 | \n",
" 0 | \n",
" 73 | \n",
" 0 | \n",
"
\n",
" \n",
"
\n",
"
\n",
"
\n",
"
"
],
"text/plain": [
""
]
},
"execution_count": 204,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"pandas_profiling.ProfileReport(df)"
]
},
{
"cell_type": "code",
"execution_count": 205,
"metadata": {
"scrolled": true
},
"outputs": [
{
"data": {
"text/html": [
"\n",
"\n",
"
\n",
" \n",
" \n",
" | \n",
" department | \n",
" education | \n",
" no_of_trainings | \n",
" age | \n",
" previous_year_rating | \n",
" length_of_service | \n",
" KPIs_met >80% | \n",
" awards_won? | \n",
" avg_training_score | \n",
" is_promoted | \n",
"
\n",
" \n",
" \n",
" \n",
" 0 | \n",
" 3 | \n",
" 3 | \n",
" 1 | \n",
" 35 | \n",
" 5.0 | \n",
" 8 | \n",
" 1 | \n",
" 0 | \n",
" 49 | \n",
" 0 | \n",
"
\n",
" \n",
" 1 | \n",
" 0 | \n",
" 2 | \n",
" 1 | \n",
" 30 | \n",
" 5.0 | \n",
" 4 | \n",
" 0 | \n",
" 0 | \n",
" 60 | \n",
" 0 | \n",
"
\n",
" \n",
" 2 | \n",
" 3 | \n",
" 2 | \n",
" 1 | \n",
" 34 | \n",
" 3.0 | \n",
" 7 | \n",
" 0 | \n",
" 0 | \n",
" 50 | \n",
" 0 | \n",
"
\n",
" \n",
" 3 | \n",
" 3 | \n",
" 2 | \n",
" 2 | \n",
" 39 | \n",
" 1.0 | \n",
" 10 | \n",
" 0 | \n",
" 0 | \n",
" 50 | \n",
" 0 | \n",
"
\n",
" \n",
" 4 | \n",
" 1 | \n",
" 2 | \n",
" 1 | \n",
" 45 | \n",
" 3.0 | \n",
" 2 | \n",
" 0 | \n",
" 0 | \n",
" 73 | \n",
" 0 | \n",
"
\n",
" \n",
" 5 | \n",
" 7 | \n",
" 2 | \n",
" 2 | \n",
" 31 | \n",
" 3.0 | \n",
" 7 | \n",
" 0 | \n",
" 0 | \n",
" 85 | \n",
" 0 | \n",
"
\n",
" \n",
" 6 | \n",
" 0 | \n",
" 2 | \n",
" 1 | \n",
" 31 | \n",
" 3.0 | \n",
" 5 | \n",
" 0 | \n",
" 0 | \n",
" 59 | \n",
" 0 | \n",
"
\n",
" \n",
" 7 | \n",
" 0 | \n",
" 3 | \n",
" 1 | \n",
" 33 | \n",
" 3.0 | \n",
" 6 | \n",
" 0 | \n",
" 0 | \n",
" 63 | \n",
" 0 | \n",
"
\n",
" \n",
" 8 | \n",
" 7 | \n",
" 2 | \n",
" 1 | \n",
" 28 | \n",
" 4.0 | \n",
" 5 | \n",
" 0 | \n",
" 0 | \n",
" 83 | \n",
" 0 | \n",
"
\n",
" \n",
" 9 | \n",
" 3 | \n",
" 3 | \n",
" 1 | \n",
" 32 | \n",
" 5.0 | \n",
" 5 | \n",
" 1 | \n",
" 0 | \n",
" 54 | \n",
" 0 | \n",
"
\n",
" \n",
" 10 | \n",
" 1 | \n",
" 0 | \n",
" 1 | \n",
" 30 | \n",
" 0.0 | \n",
" 1 | \n",
" 0 | \n",
" 0 | \n",
" 77 | \n",
" 0 | \n",
"
\n",
" \n",
" 11 | \n",
" 3 | \n",
" 2 | \n",
" 1 | \n",
" 35 | \n",
" 5.0 | \n",
" 3 | \n",
" 1 | \n",
" 0 | \n",
" 50 | \n",
" 1 | \n",
"
\n",
" \n",
" 12 | \n",
" 3 | \n",
" 2 | \n",
" 1 | \n",
" 49 | \n",
" 5.0 | \n",
" 5 | \n",
" 1 | \n",
" 0 | \n",
" 49 | \n",
" 0 | \n",
"
\n",
" \n",
" 13 | \n",
" 1 | \n",
" 3 | \n",
" 2 | \n",
" 39 | \n",
" 3.0 | \n",
" 16 | \n",
" 0 | \n",
" 0 | \n",
" 80 | \n",
" 0 | \n",
"
\n",
" \n",
" 14 | \n",
" 8 | \n",
" 3 | \n",
" 1 | \n",
" 37 | \n",
" 3.0 | \n",
" 7 | \n",
" 0 | \n",
" 0 | \n",
" 84 | \n",
" 0 | \n",
"
\n",
" \n",
" 15 | \n",
" 0 | \n",
" 2 | \n",
" 1 | \n",
" 37 | \n",
" 1.0 | \n",
" 10 | \n",
" 0 | \n",
" 0 | \n",
" 60 | \n",
" 0 | \n",
"
\n",
" \n",
" 16 | \n",
" 1 | \n",
" 2 | \n",
" 1 | \n",
" 38 | \n",
" 3.0 | \n",
" 5 | \n",
" 1 | \n",
" 0 | \n",
" 77 | \n",
" 0 | \n",
"
\n",
" \n",
" 17 | \n",
" 3 | \n",
" 2 | \n",
" 1 | \n",
" 34 | \n",
" 1.0 | \n",
" 4 | \n",
" 0 | \n",
" 0 | \n",
" 51 | \n",
" 0 | \n",
"
\n",
" \n",
" 18 | \n",
" 3 | \n",
" 2 | \n",
" 1 | \n",
" 34 | \n",
" 5.0 | \n",
" 8 | \n",
" 1 | \n",
" 0 | \n",
" 46 | \n",
" 0 | \n",
"
\n",
" \n",
" 19 | \n",
" 0 | \n",
" 2 | \n",
" 1 | \n",
" 37 | \n",
" 3.0 | \n",
" 9 | \n",
" 0 | \n",
" 0 | \n",
" 59 | \n",
" 0 | \n",
"
\n",
" \n",
" 20 | \n",
" 6 | \n",
" 2 | \n",
" 1 | \n",
" 35 | \n",
" 3.0 | \n",
" 7 | \n",
" 0 | \n",
" 0 | \n",
" 75 | \n",
" 0 | \n",
"
\n",
" \n",
" 21 | \n",
" 0 | \n",
" 0 | \n",
" 1 | \n",
" 41 | \n",
" 4.0 | \n",
" 11 | \n",
" 0 | \n",
" 0 | \n",
" 57 | \n",
" 0 | \n",
"
\n",
" \n",
" 22 | \n",
" 2 | \n",
" 2 | \n",
" 1 | \n",
" 28 | \n",
" 3.0 | \n",
" 4 | \n",
" 0 | \n",
" 0 | \n",
" 63 | \n",
" 0 | \n",
"
\n",
" \n",
" 23 | \n",
" 6 | \n",
" 2 | \n",
" 1 | \n",
" 27 | \n",
" 0.0 | \n",
" 1 | \n",
" 0 | \n",
" 0 | \n",
" 70 | \n",
" 0 | \n",
"
\n",
" \n",
" 24 | \n",
" 2 | \n",
" 3 | \n",
" 2 | \n",
" 39 | \n",
" 5.0 | \n",
" 7 | \n",
" 0 | \n",
" 0 | \n",
" 59 | \n",
" 0 | \n",
"
\n",
" \n",
" 25 | \n",
" 1 | \n",
" 2 | \n",
" 1 | \n",
" 27 | \n",
" 5.0 | \n",
" 3 | \n",
" 1 | \n",
" 0 | \n",
" 83 | \n",
" 0 | \n",
"
\n",
" \n",
" 26 | \n",
" 6 | \n",
" 2 | \n",
" 1 | \n",
" 31 | \n",
" 5.0 | \n",
" 4 | \n",
" 1 | \n",
" 0 | \n",
" 68 | \n",
" 0 | \n",
"
\n",
" \n",
" 27 | \n",
" 1 | \n",
" 2 | \n",
" 1 | \n",
" 33 | \n",
" 4.0 | \n",
" 4 | \n",
" 0 | \n",
" 0 | \n",
" 79 | \n",
" 0 | \n",
"
\n",
" \n",
" 28 | \n",
" 7 | \n",
" 2 | \n",
" 1 | \n",
" 29 | \n",
" 5.0 | \n",
" 3 | \n",
" 1 | \n",
" 0 | \n",
" 80 | \n",
" 0 | \n",
"
\n",
" \n",
" 29 | \n",
" 3 | \n",
" 2 | \n",
" 1 | \n",
" 26 | \n",
" 0.0 | \n",
" 1 | \n",
" 0 | \n",
" 0 | \n",
" 44 | \n",
" 0 | \n",
"
\n",
" \n",
" ... | \n",
" ... | \n",
" ... | \n",
" ... | \n",
" ... | \n",
" ... | \n",
" ... | \n",
" ... | \n",
" ... | \n",
" ... | \n",
" ... | \n",
"
\n",
" \n",
" 54775 | \n",
" 0 | \n",
" 2 | \n",
" 1 | \n",
" 30 | \n",
" 1.0 | \n",
" 4 | \n",
" 0 | \n",
" 0 | \n",
" 60 | \n",
" 0 | \n",
"
\n",
" \n",
" 54776 | \n",
" 5 | \n",
" 1 | \n",
" 1 | \n",
" 22 | \n",
" 5.0 | \n",
" 2 | \n",
" 0 | \n",
" 0 | \n",
" 47 | \n",
" 0 | \n",
"
\n",
" \n",
" 54777 | \n",
" 1 | \n",
" 2 | \n",
" 1 | \n",
" 52 | \n",
" 2.0 | \n",
" 3 | \n",
" 0 | \n",
" 0 | \n",
" 77 | \n",
" 0 | \n",
"
\n",
" \n",
" 54779 | \n",
" 1 | \n",
" 2 | \n",
" 1 | \n",
" 34 | \n",
" 3.0 | \n",
" 3 | \n",
" 0 | \n",
" 0 | \n",
" 86 | \n",
" 0 | \n",
"
\n",
" \n",
" 54780 | \n",
" 0 | \n",
" 2 | \n",
" 1 | \n",
" 39 | \n",
" 5.0 | \n",
" 7 | \n",
" 0 | \n",
" 0 | \n",
" 60 | \n",
" 0 | \n",
"
\n",
" \n",
" 54781 | \n",
" 5 | \n",
" 2 | \n",
" 1 | \n",
" 38 | \n",
" 5.0 | \n",
" 3 | \n",
" 1 | \n",
" 0 | \n",
" 50 | \n",
" 0 | \n",
"
\n",
" \n",
" 54782 | \n",
" 0 | \n",
" 1 | \n",
" 2 | \n",
" 26 | \n",
" 3.0 | \n",
" 2 | \n",
" 0 | \n",
" 0 | \n",
" 60 | \n",
" 0 | \n",
"
\n",
" \n",
" 54783 | \n",
" 6 | \n",
" 1 | \n",
" 3 | \n",
" 23 | \n",
" 3.0 | \n",
" 2 | \n",
" 0 | \n",
" 0 | \n",
" 71 | \n",
" 0 | \n",
"
\n",
" \n",
" 54784 | \n",
" 3 | \n",
" 2 | \n",
" 1 | \n",
" 39 | \n",
" 5.0 | \n",
" 9 | \n",
" 0 | \n",
" 0 | \n",
" 48 | \n",
" 0 | \n",
"
\n",
" \n",
" 54785 | \n",
" 1 | \n",
" 2 | \n",
" 1 | \n",
" 33 | \n",
" 4.0 | \n",
" 7 | \n",
" 1 | \n",
" 0 | \n",
" 77 | \n",
" 0 | \n",
"
\n",
" \n",
" 54787 | \n",
" 1 | \n",
" 2 | \n",
" 4 | \n",
" 26 | \n",
" 3.0 | \n",
" 3 | \n",
" 0 | \n",
" 0 | \n",
" 84 | \n",
" 0 | \n",
"
\n",
" \n",
" 54789 | \n",
" 3 | \n",
" 3 | \n",
" 3 | \n",
" 31 | \n",
" 3.0 | \n",
" 9 | \n",
" 0 | \n",
" 0 | \n",
" 50 | \n",
" 0 | \n",
"
\n",
" \n",
" 54790 | \n",
" 5 | \n",
" 2 | \n",
" 1 | \n",
" 48 | \n",
" 5.0 | \n",
" 4 | \n",
" 0 | \n",
" 0 | \n",
" 49 | \n",
" 0 | \n",
"
\n",
" \n",
" 54791 | \n",
" 1 | \n",
" 2 | \n",
" 1 | \n",
" 32 | \n",
" 1.0 | \n",
" 3 | \n",
" 1 | \n",
" 0 | \n",
" 82 | \n",
" 0 | \n",
"
\n",
" \n",
" 54792 | \n",
" 3 | \n",
" 2 | \n",
" 1 | \n",
" 59 | \n",
" 3.0 | \n",
" 11 | \n",
" 0 | \n",
" 0 | \n",
" 65 | \n",
" 1 | \n",
"
\n",
" \n",
" 54793 | \n",
" 1 | \n",
" 2 | \n",
" 1 | \n",
" 33 | \n",
" 1.0 | \n",
" 9 | \n",
" 0 | \n",
" 0 | \n",
" 79 | \n",
" 0 | \n",
"
\n",
" \n",
" 54794 | \n",
" 0 | \n",
" 2 | \n",
" 1 | \n",
" 37 | \n",
" 4.0 | \n",
" 7 | \n",
" 1 | \n",
" 0 | \n",
" 54 | \n",
" 0 | \n",
"
\n",
" \n",
" 54795 | \n",
" 6 | \n",
" 3 | \n",
" 1 | \n",
" 35 | \n",
" 3.0 | \n",
" 7 | \n",
" 0 | \n",
" 0 | \n",
" 70 | \n",
" 0 | \n",
"
\n",
" \n",
" 54796 | \n",
" 3 | \n",
" 3 | \n",
" 1 | \n",
" 34 | \n",
" 3.0 | \n",
" 7 | \n",
" 0 | \n",
" 0 | \n",
" 60 | \n",
" 1 | \n",
"
\n",
" \n",
" 54797 | \n",
" 3 | \n",
" 2 | \n",
" 1 | \n",
" 28 | \n",
" 5.0 | \n",
" 3 | \n",
" 1 | \n",
" 1 | \n",
" 47 | \n",
" 0 | \n",
"
\n",
" \n",
" 54798 | \n",
" 3 | \n",
" 3 | \n",
" 2 | \n",
" 40 | \n",
" 5.0 | \n",
" 4 | \n",
" 1 | \n",
" 0 | \n",
" 51 | \n",
" 0 | \n",
"
\n",
" \n",
" 54799 | \n",
" 6 | \n",
" 3 | \n",
" 1 | \n",
" 50 | \n",
" 5.0 | \n",
" 6 | \n",
" 1 | \n",
" 1 | \n",
" 67 | \n",
" 0 | \n",
"
\n",
" \n",
" 54800 | \n",
" 5 | \n",
" 2 | \n",
" 2 | \n",
" 34 | \n",
" 5.0 | \n",
" 3 | \n",
" 0 | \n",
" 0 | \n",
" 52 | \n",
" 0 | \n",
"
\n",
" \n",
" 54801 | \n",
" 1 | \n",
" 2 | \n",
" 1 | \n",
" 31 | \n",
" 0.0 | \n",
" 1 | \n",
" 0 | \n",
" 0 | \n",
" 78 | \n",
" 0 | \n",
"
\n",
" \n",
" 54802 | \n",
" 3 | \n",
" 2 | \n",
" 2 | \n",
" 31 | \n",
" 1.0 | \n",
" 2 | \n",
" 0 | \n",
" 0 | \n",
" 49 | \n",
" 0 | \n",
"
\n",
" \n",
" 54803 | \n",
" 1 | \n",
" 2 | \n",
" 1 | \n",
" 48 | \n",
" 3.0 | \n",
" 17 | \n",
" 0 | \n",
" 0 | \n",
" 78 | \n",
" 0 | \n",
"
\n",
" \n",
" 54804 | \n",
" 0 | \n",
" 3 | \n",
" 1 | \n",
" 37 | \n",
" 2.0 | \n",
" 6 | \n",
" 0 | \n",
" 0 | \n",
" 56 | \n",
" 0 | \n",
"
\n",
" \n",
" 54805 | \n",
" 7 | \n",
" 2 | \n",
" 1 | \n",
" 27 | \n",
" 5.0 | \n",
" 3 | \n",
" 1 | \n",
" 0 | \n",
" 79 | \n",
" 0 | \n",
"
\n",
" \n",
" 54806 | \n",
" 3 | \n",
" 0 | \n",
" 1 | \n",
" 29 | \n",
" 1.0 | \n",
" 2 | \n",
" 0 | \n",
" 0 | \n",
" 45 | \n",
" 0 | \n",
"
\n",
" \n",
" 54807 | \n",
" 5 | \n",
" 2 | \n",
" 1 | \n",
" 27 | \n",
" 1.0 | \n",
" 5 | \n",
" 0 | \n",
" 0 | \n",
" 49 | \n",
" 0 | \n",
"
\n",
" \n",
"
\n",
"
47563 rows × 10 columns
\n",
"
"
],
"text/plain": [
" department education no_of_trainings age previous_year_rating \\\n",
"0 3 3 1 35 5.0 \n",
"1 0 2 1 30 5.0 \n",
"2 3 2 1 34 3.0 \n",
"3 3 2 2 39 1.0 \n",
"4 1 2 1 45 3.0 \n",
"5 7 2 2 31 3.0 \n",
"6 0 2 1 31 3.0 \n",
"7 0 3 1 33 3.0 \n",
"8 7 2 1 28 4.0 \n",
"9 3 3 1 32 5.0 \n",
"10 1 0 1 30 0.0 \n",
"11 3 2 1 35 5.0 \n",
"12 3 2 1 49 5.0 \n",
"13 1 3 2 39 3.0 \n",
"14 8 3 1 37 3.0 \n",
"15 0 2 1 37 1.0 \n",
"16 1 2 1 38 3.0 \n",
"17 3 2 1 34 1.0 \n",
"18 3 2 1 34 5.0 \n",
"19 0 2 1 37 3.0 \n",
"20 6 2 1 35 3.0 \n",
"21 0 0 1 41 4.0 \n",
"22 2 2 1 28 3.0 \n",
"23 6 2 1 27 0.0 \n",
"24 2 3 2 39 5.0 \n",
"25 1 2 1 27 5.0 \n",
"26 6 2 1 31 5.0 \n",
"27 1 2 1 33 4.0 \n",
"28 7 2 1 29 5.0 \n",
"29 3 2 1 26 0.0 \n",
"... ... ... ... ... ... \n",
"54775 0 2 1 30 1.0 \n",
"54776 5 1 1 22 5.0 \n",
"54777 1 2 1 52 2.0 \n",
"54779 1 2 1 34 3.0 \n",
"54780 0 2 1 39 5.0 \n",
"54781 5 2 1 38 5.0 \n",
"54782 0 1 2 26 3.0 \n",
"54783 6 1 3 23 3.0 \n",
"54784 3 2 1 39 5.0 \n",
"54785 1 2 1 33 4.0 \n",
"54787 1 2 4 26 3.0 \n",
"54789 3 3 3 31 3.0 \n",
"54790 5 2 1 48 5.0 \n",
"54791 1 2 1 32 1.0 \n",
"54792 3 2 1 59 3.0 \n",
"54793 1 2 1 33 1.0 \n",
"54794 0 2 1 37 4.0 \n",
"54795 6 3 1 35 3.0 \n",
"54796 3 3 1 34 3.0 \n",
"54797 3 2 1 28 5.0 \n",
"54798 3 3 2 40 5.0 \n",
"54799 6 3 1 50 5.0 \n",
"54800 5 2 2 34 5.0 \n",
"54801 1 2 1 31 0.0 \n",
"54802 3 2 2 31 1.0 \n",
"54803 1 2 1 48 3.0 \n",
"54804 0 3 1 37 2.0 \n",
"54805 7 2 1 27 5.0 \n",
"54806 3 0 1 29 1.0 \n",
"54807 5 2 1 27 1.0 \n",
"\n",
" length_of_service KPIs_met >80% awards_won? avg_training_score \\\n",
"0 8 1 0 49 \n",
"1 4 0 0 60 \n",
"2 7 0 0 50 \n",
"3 10 0 0 50 \n",
"4 2 0 0 73 \n",
"5 7 0 0 85 \n",
"6 5 0 0 59 \n",
"7 6 0 0 63 \n",
"8 5 0 0 83 \n",
"9 5 1 0 54 \n",
"10 1 0 0 77 \n",
"11 3 1 0 50 \n",
"12 5 1 0 49 \n",
"13 16 0 0 80 \n",
"14 7 0 0 84 \n",
"15 10 0 0 60 \n",
"16 5 1 0 77 \n",
"17 4 0 0 51 \n",
"18 8 1 0 46 \n",
"19 9 0 0 59 \n",
"20 7 0 0 75 \n",
"21 11 0 0 57 \n",
"22 4 0 0 63 \n",
"23 1 0 0 70 \n",
"24 7 0 0 59 \n",
"25 3 1 0 83 \n",
"26 4 1 0 68 \n",
"27 4 0 0 79 \n",
"28 3 1 0 80 \n",
"29 1 0 0 44 \n",
"... ... ... ... ... \n",
"54775 4 0 0 60 \n",
"54776 2 0 0 47 \n",
"54777 3 0 0 77 \n",
"54779 3 0 0 86 \n",
"54780 7 0 0 60 \n",
"54781 3 1 0 50 \n",
"54782 2 0 0 60 \n",
"54783 2 0 0 71 \n",
"54784 9 0 0 48 \n",
"54785 7 1 0 77 \n",
"54787 3 0 0 84 \n",
"54789 9 0 0 50 \n",
"54790 4 0 0 49 \n",
"54791 3 1 0 82 \n",
"54792 11 0 0 65 \n",
"54793 9 0 0 79 \n",
"54794 7 1 0 54 \n",
"54795 7 0 0 70 \n",
"54796 7 0 0 60 \n",
"54797 3 1 1 47 \n",
"54798 4 1 0 51 \n",
"54799 6 1 1 67 \n",
"54800 3 0 0 52 \n",
"54801 1 0 0 78 \n",
"54802 2 0 0 49 \n",
"54803 17 0 0 78 \n",
"54804 6 0 0 56 \n",
"54805 3 1 0 79 \n",
"54806 2 0 0 45 \n",
"54807 5 0 0 49 \n",
"\n",
" is_promoted \n",
"0 0 \n",
"1 0 \n",
"2 0 \n",
"3 0 \n",
"4 0 \n",
"5 0 \n",
"6 0 \n",
"7 0 \n",
"8 0 \n",
"9 0 \n",
"10 0 \n",
"11 1 \n",
"12 0 \n",
"13 0 \n",
"14 0 \n",
"15 0 \n",
"16 0 \n",
"17 0 \n",
"18 0 \n",
"19 0 \n",
"20 0 \n",
"21 0 \n",
"22 0 \n",
"23 0 \n",
"24 0 \n",
"25 0 \n",
"26 0 \n",
"27 0 \n",
"28 0 \n",
"29 0 \n",
"... ... \n",
"54775 0 \n",
"54776 0 \n",
"54777 0 \n",
"54779 0 \n",
"54780 0 \n",
"54781 0 \n",
"54782 0 \n",
"54783 0 \n",
"54784 0 \n",
"54785 0 \n",
"54787 0 \n",
"54789 0 \n",
"54790 0 \n",
"54791 0 \n",
"54792 1 \n",
"54793 0 \n",
"54794 0 \n",
"54795 0 \n",
"54796 1 \n",
"54797 0 \n",
"54798 0 \n",
"54799 0 \n",
"54800 0 \n",
"54801 0 \n",
"54802 0 \n",
"54803 0 \n",
"54804 0 \n",
"54805 0 \n",
"54806 0 \n",
"54807 0 \n",
"\n",
"[47563 rows x 10 columns]"
]
},
"execution_count": 205,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"df"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"## Scaling:"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"### Training:"
]
},
{
"cell_type": "code",
"execution_count": null,
"metadata": {},
"outputs": [],
"source": [
"for i in range[1,35000]:\n",
" if df['is_promoted'].loc(i):\n",
" df.loc(i).drop"
]
},
{
"cell_type": "code",
"execution_count": 189,
"metadata": {},
"outputs": [],
"source": [
"from sklearn.preprocessing import StandardScaler\n",
"\n",
"scaler = StandardScaler()"
]
},
{
"cell_type": "code",
"execution_count": 206,
"metadata": {},
"outputs": [],
"source": [
"X = df.drop(['is_promoted'],1)\n",
"y = df['is_promoted']"
]
},
{
"cell_type": "code",
"execution_count": 207,
"metadata": {},
"outputs": [],
"source": [
"X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=0, test_size=0.3)"
]
},
{
"cell_type": "code",
"execution_count": null,
"metadata": {},
"outputs": [],
"source": [
"from sklearn.ensemble import GradientBoostingClassifier\n",
"clf = GradientBoostingClassifier(max_depth=7)\n",
"clf.fit(X,y)\n",
"\n",
"# pred = clf.predict(X_test)\n",
"# print(accuracy_score(y_test, pred))\n",
"\n",
"# f1_score(y_test, pred)"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"### Test:"
]
},
{
"cell_type": "code",
"execution_count": 241,
"metadata": {},
"outputs": [],
"source": [
"df_test =pd.read_csv('test.csv')\n",
"employee_id = df_test['employee_id']"
]
},
{
"cell_type": "code",
"execution_count": 244,
"metadata": {},
"outputs": [
{
"data": {
"text/html": [
"\n",
"\n",
"\n",
"\n",
"\n",
"
\n",
"
Overview
\n",
" \n",
"
\n",
"
\n",
"
Dataset info
\n",
"
\n",
" \n",
" \n",
" Number of variables | \n",
" 13 | \n",
"
\n",
" \n",
" Number of observations | \n",
" 23490 | \n",
"
\n",
" \n",
" Total Missing (%) | \n",
" 0.9% | \n",
"
\n",
" \n",
" Total size in memory | \n",
" 2.3 MiB | \n",
"
\n",
" \n",
" Average record size in memory | \n",
" 104.0 B | \n",
"
\n",
" \n",
"
\n",
"
\n",
"
\n",
"
Variables types
\n",
"
\n",
" \n",
" \n",
" Numeric | \n",
" 6 | \n",
"
\n",
" \n",
" Categorical | \n",
" 5 | \n",
"
\n",
" \n",
" Boolean | \n",
" 2 | \n",
"
\n",
" \n",
" Date | \n",
" 0 | \n",
"
\n",
" \n",
" Text (Unique) | \n",
" 0 | \n",
"
\n",
" \n",
" Rejected | \n",
" 0 | \n",
"
\n",
" \n",
" Unsupported | \n",
" 0 | \n",
"
\n",
" \n",
"
\n",
"
\n",
"
\n",
" \n",
"
Warnings
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Variables
\n",
" \n",
"
\n",
"
\n",
"
80%\">KPIs_met >80%
\n",
" Boolean\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 2 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Mean | \n",
" 0.35883 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" 0 | \n",
" \n",
" \n",
" 15061\n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" \n",
" \n",
" 8429\n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0 | \n",
" 15061 | \n",
" 64.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" 8429 | \n",
" 35.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
age
\n",
" Numeric\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 41 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.2% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
" \n",
" Infinite (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Infinite (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"\n",
" \n",
" Mean | \n",
" 34.783 | \n",
"
\n",
" \n",
" Minimum | \n",
" 20 | \n",
"
\n",
" \n",
" Maximum | \n",
" 60 | \n",
"
\n",
" \n",
" Zeros (%) | \n",
" 0.0% | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
Quantile statistics
\n",
"
\n",
" \n",
" Minimum | \n",
" 20 | \n",
"
\n",
" \n",
" 5-th percentile | \n",
" 25 | \n",
"
\n",
" \n",
" Q1 | \n",
" 29 | \n",
"
\n",
" \n",
" Median | \n",
" 33 | \n",
"
\n",
" \n",
" Q3 | \n",
" 39 | \n",
"
\n",
" \n",
" 95-th percentile | \n",
" 51 | \n",
"
\n",
" \n",
" Maximum | \n",
" 60 | \n",
"
\n",
" \n",
" Range | \n",
" 40 | \n",
"
\n",
" \n",
" Interquartile range | \n",
" 10 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Descriptive statistics
\n",
"
\n",
" \n",
" Standard deviation | \n",
" 7.6795 | \n",
"
\n",
" \n",
" Coef of variation | \n",
" 0.22078 | \n",
"
\n",
" \n",
" Kurtosis | \n",
" 0.7926 | \n",
"
\n",
" \n",
" Mean | \n",
" 34.783 | \n",
"
\n",
" \n",
" MAD | \n",
" 5.9805 | \n",
"
\n",
" \n",
" Skewness | \n",
" 1.0118 | \n",
"
\n",
" \n",
" Sum | \n",
" 817051 | \n",
"
\n",
" \n",
" Variance | \n",
" 58.975 | \n",
"
\n",
" \n",
" Memory size | \n",
" 183.6 KiB | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 30 | \n",
" 1595 | \n",
" 6.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 31 | \n",
" 1526 | \n",
" 6.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 32 | \n",
" 1481 | \n",
" 6.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 29 | \n",
" 1456 | \n",
" 6.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 33 | \n",
" 1387 | \n",
" 5.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 28 | \n",
" 1362 | \n",
" 5.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 34 | \n",
" 1321 | \n",
" 5.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 27 | \n",
" 1234 | \n",
" 5.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 35 | \n",
" 1169 | \n",
" 5.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 36 | \n",
" 1022 | \n",
" 4.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Other values (31) | \n",
" 9937 | \n",
" 42.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Minimum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 20 | \n",
" 51 | \n",
" 0.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 21 | \n",
" 39 | \n",
" 0.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 22 | \n",
" 98 | \n",
" 0.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 23 | \n",
" 214 | \n",
" 0.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 24 | \n",
" 336 | \n",
" 1.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
Maximum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 56 | \n",
" 121 | \n",
" 0.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 57 | \n",
" 95 | \n",
" 0.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 58 | \n",
" 104 | \n",
" 0.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 59 | \n",
" 83 | \n",
" 0.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 60 | \n",
" 89 | \n",
" 0.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
avg_training_score
\n",
" Numeric\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 61 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.3% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
" \n",
" Infinite (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Infinite (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"\n",
" \n",
" Mean | \n",
" 63.263 | \n",
"
\n",
" \n",
" Minimum | \n",
" 39 | \n",
"
\n",
" \n",
" Maximum | \n",
" 99 | \n",
"
\n",
" \n",
" Zeros (%) | \n",
" 0.0% | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
Quantile statistics
\n",
"
\n",
" \n",
" Minimum | \n",
" 39 | \n",
"
\n",
" \n",
" 5-th percentile | \n",
" 47 | \n",
"
\n",
" \n",
" Q1 | \n",
" 51 | \n",
"
\n",
" \n",
" Median | \n",
" 60 | \n",
"
\n",
" \n",
" Q3 | \n",
" 76 | \n",
"
\n",
" \n",
" 95-th percentile | \n",
" 86 | \n",
"
\n",
" \n",
" Maximum | \n",
" 99 | \n",
"
\n",
" \n",
" Range | \n",
" 60 | \n",
"
\n",
" \n",
" Interquartile range | \n",
" 25 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Descriptive statistics
\n",
"
\n",
" \n",
" Standard deviation | \n",
" 13.412 | \n",
"
\n",
" \n",
" Coef of variation | \n",
" 0.212 | \n",
"
\n",
" \n",
" Kurtosis | \n",
" -1.0521 | \n",
"
\n",
" \n",
" Mean | \n",
" 63.263 | \n",
"
\n",
" \n",
" MAD | \n",
" 11.592 | \n",
"
\n",
" \n",
" Skewness | \n",
" 0.45811 | \n",
"
\n",
" \n",
" Sum | \n",
" 1486051 | \n",
"
\n",
" \n",
" Variance | \n",
" 179.88 | \n",
"
\n",
" \n",
" Memory size | \n",
" 183.6 KiB | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 50 | \n",
" 1227 | \n",
" 5.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 49 | \n",
" 1144 | \n",
" 4.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 48 | \n",
" 1084 | \n",
" 4.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 51 | \n",
" 1023 | \n",
" 4.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 60 | \n",
" 889 | \n",
" 3.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 59 | \n",
" 877 | \n",
" 3.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 52 | \n",
" 791 | \n",
" 3.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 58 | \n",
" 789 | \n",
" 3.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 47 | \n",
" 787 | \n",
" 3.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 61 | \n",
" 768 | \n",
" 3.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Other values (51) | \n",
" 14111 | \n",
" 60.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Minimum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 39 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 40 | \n",
" 3 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 41 | \n",
" 11 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 42 | \n",
" 16 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 43 | \n",
" 68 | \n",
" 0.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
Maximum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 95 | \n",
" 23 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 96 | \n",
" 27 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 97 | \n",
" 22 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 98 | \n",
" 14 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 99 | \n",
" 13 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
awards_won?
\n",
" Boolean\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 2 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Mean | \n",
" 0.022776 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" 0 | \n",
" \n",
" \n",
" 22955\n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" \n",
" \n",
" \n",
" \n",
" 535\n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 0 | \n",
" 22955 | \n",
" 97.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" 535 | \n",
" 2.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
department
\n",
" Categorical\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 9 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Sales & Marketing | \n",
" \n",
" \n",
" 7315\n",
" \n",
" \n",
" | \n",
"
\n",
" Operations | \n",
" \n",
" \n",
" 4764\n",
" \n",
" \n",
" | \n",
"
\n",
" Procurement | \n",
" \n",
" \n",
" 3020\n",
" \n",
" \n",
" | \n",
"
\n",
" Other values (6) | \n",
" \n",
" \n",
" 8391\n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" Sales & Marketing | \n",
" 7315 | \n",
" 31.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Operations | \n",
" 4764 | \n",
" 20.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Procurement | \n",
" 3020 | \n",
" 12.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Technology | \n",
" 3011 | \n",
" 12.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Analytics | \n",
" 2319 | \n",
" 9.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Finance | \n",
" 1091 | \n",
" 4.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
" HR | \n",
" 1085 | \n",
" 4.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Legal | \n",
" 445 | \n",
" 1.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" R&D | \n",
" 440 | \n",
" 1.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
education
\n",
" Categorical\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 4 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 4.4% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 1034 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Bachelor's | \n",
" \n",
" \n",
" 15578\n",
" \n",
" \n",
" | \n",
"
\n",
" Master's & above | \n",
" \n",
" \n",
" 6504\n",
" \n",
" \n",
" | \n",
"
\n",
" Below Secondary | \n",
" \n",
" \n",
" \n",
" \n",
" 374\n",
" | \n",
"
\n",
" (Missing) | \n",
" \n",
" \n",
" \n",
" \n",
" 1034\n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" Bachelor's | \n",
" 15578 | \n",
" 66.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Master's & above | \n",
" 6504 | \n",
" 27.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Below Secondary | \n",
" 374 | \n",
" 1.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
" (Missing) | \n",
" 1034 | \n",
" 4.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
employee_id
\n",
" Numeric\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 23490 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 100.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
" \n",
" Infinite (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Infinite (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"\n",
" \n",
" Mean | \n",
" 39041 | \n",
"
\n",
" \n",
" Minimum | \n",
" 3 | \n",
"
\n",
" \n",
" Maximum | \n",
" 78295 | \n",
"
\n",
" \n",
" Zeros (%) | \n",
" 0.0% | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
Quantile statistics
\n",
"
\n",
" \n",
" Minimum | \n",
" 3 | \n",
"
\n",
" \n",
" 5-th percentile | \n",
" 3914 | \n",
"
\n",
" \n",
" Q1 | \n",
" 19370 | \n",
"
\n",
" \n",
" Median | \n",
" 38964 | \n",
"
\n",
" \n",
" Q3 | \n",
" 58690 | \n",
"
\n",
" \n",
" 95-th percentile | \n",
" 74330 | \n",
"
\n",
" \n",
" Maximum | \n",
" 78295 | \n",
"
\n",
" \n",
" Range | \n",
" 78292 | \n",
"
\n",
" \n",
" Interquartile range | \n",
" 39320 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Descriptive statistics
\n",
"
\n",
" \n",
" Standard deviation | \n",
" 22641 | \n",
"
\n",
" \n",
" Coef of variation | \n",
" 0.57992 | \n",
"
\n",
" \n",
" Kurtosis | \n",
" -1.208 | \n",
"
\n",
" \n",
" Mean | \n",
" 39041 | \n",
"
\n",
" \n",
" MAD | \n",
" 19642 | \n",
"
\n",
" \n",
" Skewness | \n",
" 0.0073148 | \n",
"
\n",
" \n",
" Sum | \n",
" 917082466 | \n",
"
\n",
" \n",
" Variance | \n",
" 512610000 | \n",
"
\n",
" \n",
" Memory size | \n",
" 183.6 KiB | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 34815 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 39622 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 60104 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 25289 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 23902 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 34982 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 51916 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 70340 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 26268 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 29326 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Other values (23480) | \n",
" 23480 | \n",
" 100.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Minimum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 3 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 6 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 11 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 13 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 16 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
Maximum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 78280 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 78283 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 78284 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 78293 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 78295 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
gender
\n",
" Categorical\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 2 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" m | \n",
" \n",
" \n",
" 16596\n",
" \n",
" \n",
" | \n",
"
\n",
" f | \n",
" \n",
" \n",
" 6894\n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" m | \n",
" 16596 | \n",
" 70.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" f | \n",
" 6894 | \n",
" 29.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
length_of_service
\n",
" Numeric\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 34 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.1% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
" \n",
" Infinite (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Infinite (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"\n",
" \n",
" Mean | \n",
" 5.8104 | \n",
"
\n",
" \n",
" Minimum | \n",
" 1 | \n",
"
\n",
" \n",
" Maximum | \n",
" 34 | \n",
"
\n",
" \n",
" Zeros (%) | \n",
" 0.0% | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
Quantile statistics
\n",
"
\n",
" \n",
" Minimum | \n",
" 1 | \n",
"
\n",
" \n",
" 5-th percentile | \n",
" 1 | \n",
"
\n",
" \n",
" Q1 | \n",
" 3 | \n",
"
\n",
" \n",
" Median | \n",
" 5 | \n",
"
\n",
" \n",
" Q3 | \n",
" 7 | \n",
"
\n",
" \n",
" 95-th percentile | \n",
" 15 | \n",
"
\n",
" \n",
" Maximum | \n",
" 34 | \n",
"
\n",
" \n",
" Range | \n",
" 33 | \n",
"
\n",
" \n",
" Interquartile range | \n",
" 4 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Descriptive statistics
\n",
"
\n",
" \n",
" Standard deviation | \n",
" 4.2079 | \n",
"
\n",
" \n",
" Coef of variation | \n",
" 0.72421 | \n",
"
\n",
" \n",
" Kurtosis | \n",
" 4.1262 | \n",
"
\n",
" \n",
" Mean | \n",
" 5.8104 | \n",
"
\n",
" \n",
" MAD | \n",
" 3.1003 | \n",
"
\n",
" \n",
" Skewness | \n",
" 1.703 | \n",
"
\n",
" \n",
" Sum | \n",
" 136486 | \n",
"
\n",
" \n",
" Variance | \n",
" 17.707 | \n",
"
\n",
" \n",
" Memory size | \n",
" 183.6 KiB | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 3 | \n",
" 3033 | \n",
" 12.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 4 | \n",
" 2911 | \n",
" 12.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 2 | \n",
" 2870 | \n",
" 12.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 5 | \n",
" 2592 | \n",
" 11.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 7 | \n",
" 2344 | \n",
" 10.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 6 | \n",
" 2038 | \n",
" 8.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1 | \n",
" 1992 | \n",
" 8.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 8 | \n",
" 1263 | \n",
" 5.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 9 | \n",
" 1070 | \n",
" 4.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 10 | \n",
" 941 | \n",
" 4.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Other values (24) | \n",
" 2436 | \n",
" 10.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Minimum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 1 | \n",
" 1992 | \n",
" 8.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 2 | \n",
" 2870 | \n",
" 12.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 3 | \n",
" 3033 | \n",
" 12.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 4 | \n",
" 2911 | \n",
" 12.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 5 | \n",
" 2592 | \n",
" 11.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
Maximum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 30 | \n",
" 6 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 31 | \n",
" 7 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 32 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 33 | \n",
" 1 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 34 | \n",
" 2 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
no_of_trainings
\n",
" Numeric\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 9 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
" \n",
" Infinite (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Infinite (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"\n",
" \n",
" Mean | \n",
" 1.2542 | \n",
"
\n",
" \n",
" Minimum | \n",
" 1 | \n",
"
\n",
" \n",
" Maximum | \n",
" 9 | \n",
"
\n",
" \n",
" Zeros (%) | \n",
" 0.0% | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
Quantile statistics
\n",
"
\n",
" \n",
" Minimum | \n",
" 1 | \n",
"
\n",
" \n",
" 5-th percentile | \n",
" 1 | \n",
"
\n",
" \n",
" Q1 | \n",
" 1 | \n",
"
\n",
" \n",
" Median | \n",
" 1 | \n",
"
\n",
" \n",
" Q3 | \n",
" 1 | \n",
"
\n",
" \n",
" 95-th percentile | \n",
" 2 | \n",
"
\n",
" \n",
" Maximum | \n",
" 9 | \n",
"
\n",
" \n",
" Range | \n",
" 8 | \n",
"
\n",
" \n",
" Interquartile range | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Descriptive statistics
\n",
"
\n",
" \n",
" Standard deviation | \n",
" 0.60091 | \n",
"
\n",
" \n",
" Coef of variation | \n",
" 0.4791 | \n",
"
\n",
" \n",
" Kurtosis | \n",
" 16.399 | \n",
"
\n",
" \n",
" Mean | \n",
" 1.2542 | \n",
"
\n",
" \n",
" MAD | \n",
" 0.40972 | \n",
"
\n",
" \n",
" Skewness | \n",
" 3.2998 | \n",
"
\n",
" \n",
" Sum | \n",
" 29462 | \n",
"
\n",
" \n",
" Variance | \n",
" 0.36109 | \n",
"
\n",
" \n",
" Memory size | \n",
" 183.6 KiB | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 1 | \n",
" 18928 | \n",
" 80.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 2 | \n",
" 3544 | \n",
" 15.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 3 | \n",
" 755 | \n",
" 3.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 4 | \n",
" 190 | \n",
" 0.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 5 | \n",
" 36 | \n",
" 0.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 6 | \n",
" 24 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 7 | \n",
" 9 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 9 | \n",
" 2 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 8 | \n",
" 2 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Minimum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 1 | \n",
" 18928 | \n",
" 80.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 2 | \n",
" 3544 | \n",
" 15.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 3 | \n",
" 755 | \n",
" 3.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 4 | \n",
" 190 | \n",
" 0.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 5 | \n",
" 36 | \n",
" 0.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
Maximum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 5 | \n",
" 36 | \n",
" 0.2% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 6 | \n",
" 24 | \n",
" 0.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 7 | \n",
" 9 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 8 | \n",
" 2 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 9 | \n",
" 2 | \n",
" 0.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
previous_year_rating
\n",
" Numeric\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 6 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 7.7% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 1812 | \n",
"
\n",
" \n",
" Infinite (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Infinite (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"\n",
" \n",
" Mean | \n",
" 3.3391 | \n",
"
\n",
" \n",
" Minimum | \n",
" 1 | \n",
"
\n",
" \n",
" Maximum | \n",
" 5 | \n",
"
\n",
" \n",
" Zeros (%) | \n",
" 0.0% | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
\n",
"\n",
"
\n",
"
\n",
"
\n",
"
Quantile statistics
\n",
"
\n",
" \n",
" Minimum | \n",
" 1 | \n",
"
\n",
" \n",
" 5-th percentile | \n",
" 1 | \n",
"
\n",
" \n",
" Q1 | \n",
" 3 | \n",
"
\n",
" \n",
" Median | \n",
" 3 | \n",
"
\n",
" \n",
" Q3 | \n",
" 4 | \n",
"
\n",
" \n",
" 95-th percentile | \n",
" 5 | \n",
"
\n",
" \n",
" Maximum | \n",
" 5 | \n",
"
\n",
" \n",
" Range | \n",
" 4 | \n",
"
\n",
" \n",
" Interquartile range | \n",
" 1 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Descriptive statistics
\n",
"
\n",
" \n",
" Standard deviation | \n",
" 1.2633 | \n",
"
\n",
" \n",
" Coef of variation | \n",
" 0.37833 | \n",
"
\n",
" \n",
" Kurtosis | \n",
" -0.72665 | \n",
"
\n",
" \n",
" Mean | \n",
" 3.3391 | \n",
"
\n",
" \n",
" MAD | \n",
" 1.0401 | \n",
"
\n",
" \n",
" Skewness | \n",
" -0.32471 | \n",
"
\n",
" \n",
" Sum | \n",
" 72386 | \n",
"
\n",
" \n",
" Variance | \n",
" 1.5959 | \n",
"
\n",
" \n",
" Memory size | \n",
" 183.6 KiB | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 3.0 | \n",
" 7921 | \n",
" 33.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 5.0 | \n",
" 5097 | \n",
" 21.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 4.0 | \n",
" 4249 | \n",
" 18.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 1.0 | \n",
" 2680 | \n",
" 11.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 2.0 | \n",
" 1731 | \n",
" 7.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" (Missing) | \n",
" 1812 | \n",
" 7.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Minimum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 1.0 | \n",
" 2680 | \n",
" 11.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 2.0 | \n",
" 1731 | \n",
" 7.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 3.0 | \n",
" 7921 | \n",
" 33.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 4.0 | \n",
" 4249 | \n",
" 18.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 5.0 | \n",
" 5097 | \n",
" 21.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
Maximum 5 values
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" 1.0 | \n",
" 2680 | \n",
" 11.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 2.0 | \n",
" 1731 | \n",
" 7.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 3.0 | \n",
" 7921 | \n",
" 33.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 4.0 | \n",
" 4249 | \n",
" 18.1% | \n",
" \n",
" \n",
" | \n",
"
\n",
" 5.0 | \n",
" 5097 | \n",
" 21.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
recruitment_channel
\n",
" Categorical\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 3 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" other | \n",
" \n",
" \n",
" 13078\n",
" \n",
" \n",
" | \n",
"
\n",
" sourcing | \n",
" \n",
" \n",
" 9961\n",
" \n",
" \n",
" | \n",
"
\n",
" referred | \n",
" \n",
" \n",
" \n",
" \n",
" 451\n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" other | \n",
" 13078 | \n",
" 55.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" sourcing | \n",
" 9961 | \n",
" 42.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" referred | \n",
" 451 | \n",
" 1.9% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
region
\n",
" Categorical\n",
"
\n",
"
\n",
"
\n",
" \n",
" Distinct count | \n",
" 34 | \n",
"
\n",
" \n",
" Unique (%) | \n",
" 0.1% | \n",
"
\n",
" \n",
" Missing (%) | \n",
" 0.0% | \n",
"
\n",
" \n",
" Missing (n) | \n",
" 0 | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
" region_2 | \n",
" \n",
" \n",
" 5299\n",
" \n",
" \n",
" | \n",
"
\n",
" region_22 | \n",
" \n",
" \n",
" 2739\n",
" \n",
" \n",
" | \n",
"
\n",
" region_7 | \n",
" \n",
" \n",
" \n",
" \n",
" 1982\n",
" | \n",
"
\n",
" Other values (31) | \n",
" \n",
" \n",
" 13470\n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
" \n",
"
\n",
" \n",
" \n",
" Value | \n",
" Count | \n",
" Frequency (%) | \n",
" | \n",
"
\n",
" \n",
" \n",
" region_2 | \n",
" 5299 | \n",
" 22.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
" region_22 | \n",
" 2739 | \n",
" 11.7% | \n",
" \n",
" \n",
" | \n",
"
\n",
" region_7 | \n",
" 1982 | \n",
" 8.4% | \n",
" \n",
" \n",
" | \n",
"
\n",
" region_13 | \n",
" 1167 | \n",
" 5.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" region_15 | \n",
" 1130 | \n",
" 4.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
" region_26 | \n",
" 1011 | \n",
" 4.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" region_31 | \n",
" 844 | \n",
" 3.6% | \n",
" \n",
" \n",
" | \n",
"
\n",
" region_4 | \n",
" 775 | \n",
" 3.3% | \n",
" \n",
" \n",
" | \n",
"
\n",
" region_27 | \n",
" 710 | \n",
" 3.0% | \n",
" \n",
" \n",
" | \n",
"
\n",
" region_28 | \n",
" 595 | \n",
" 2.5% | \n",
" \n",
" \n",
" | \n",
"
\n",
" Other values (24) | \n",
" 7238 | \n",
" 30.8% | \n",
" \n",
" \n",
" | \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Correlations
\n",
" \n",
"
\n",
"
\n",
"
\n",
"
\n",
"
\n",
"
Sample
\n",
" \n",
"
\n",
"
\n",
"
\n",
" \n",
" \n",
" | \n",
" employee_id | \n",
" department | \n",
" region | \n",
" education | \n",
" gender | \n",
" recruitment_channel | \n",
" no_of_trainings | \n",
" age | \n",
" previous_year_rating | \n",
" length_of_service | \n",
" KPIs_met >80% | \n",
" awards_won? | \n",
" avg_training_score | \n",
"
\n",
" \n",
" \n",
" \n",
" 0 | \n",
" 8724 | \n",
" Technology | \n",
" region_26 | \n",
" Bachelor's | \n",
" m | \n",
" sourcing | \n",
" 1 | \n",
" 24 | \n",
" NaN | \n",
" 1 | \n",
" 1 | \n",
" 0 | \n",
" 77 | \n",
"
\n",
" \n",
" 1 | \n",
" 74430 | \n",
" HR | \n",
" region_4 | \n",
" Bachelor's | \n",
" f | \n",
" other | \n",
" 1 | \n",
" 31 | \n",
" 3.0 | \n",
" 5 | \n",
" 0 | \n",
" 0 | \n",
" 51 | \n",
"
\n",
" \n",
" 2 | \n",
" 72255 | \n",
" Sales & Marketing | \n",
" region_13 | \n",
" Bachelor's | \n",
" m | \n",
" other | \n",
" 1 | \n",
" 31 | \n",
" 1.0 | \n",
" 4 | \n",
" 0 | \n",
" 0 | \n",
" 47 | \n",
"
\n",
" \n",
" 3 | \n",
" 38562 | \n",
" Procurement | \n",
" region_2 | \n",
" Bachelor's | \n",
" f | \n",
" other | \n",
" 3 | \n",
" 31 | \n",
" 2.0 | \n",
" 9 | \n",
" 0 | \n",
" 0 | \n",
" 65 | \n",
"
\n",
" \n",
" 4 | \n",
" 64486 | \n",
" Finance | \n",
" region_29 | \n",
" Bachelor's | \n",
" m | \n",
" sourcing | \n",
" 1 | \n",
" 30 | \n",
" 4.0 | \n",
" 7 | \n",
" 0 | \n",
" 0 | \n",
" 61 | \n",
"
\n",
" \n",
"
\n",
"
\n",
"
\n",
"
"
],
"text/plain": [
""
]
},
"execution_count": 244,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"pandas_profiling.ProfileReport(df_test)"
]
},
{
"cell_type": "code",
"execution_count": 245,
"metadata": {},
"outputs": [],
"source": [
"df_test.drop(['employee_id','recruitment_channel','region','gender'], axis=1, inplace = True, index = None)\n",
"df_test['previous_year_rating'].fillna(0, inplace=True)"
]
},
{
"cell_type": "code",
"execution_count": 246,
"metadata": {},
"outputs": [],
"source": [
"df_test = handle_non_numerical_data(df_test)"
]
},
{
"cell_type": "code",
"execution_count": 247,
"metadata": {},
"outputs": [],
"source": [
"prediction = clf.predict(df_test)"
]
},
{
"cell_type": "code",
"execution_count": 248,
"metadata": {},
"outputs": [
{
"data": {
"text/plain": [
"array([0, 0, 0, ..., 0, 0, 1])"
]
},
"execution_count": 248,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"prediction"
]
},
{
"cell_type": "code",
"execution_count": 250,
"metadata": {},
"outputs": [],
"source": [
"submission = pd.DataFrame()\n",
"submission['employee_id'] = employee_id\n",
"submission['is_promoted'] = prediction"
]
},
{
"cell_type": "code",
"execution_count": 253,
"metadata": {},
"outputs": [],
"source": [
"submission.to_csv('submission.csv', index = False)"
]
},
{
"cell_type": "code",
"execution_count": null,
"metadata": {},
"outputs": [],
"source": []
}
],
"metadata": {
"kernelspec": {
"display_name": "Python 3",
"language": "python",
"name": "python3"
},
"language_info": {
"codemirror_mode": {
"name": "ipython",
"version": 3
},
"file_extension": ".py",
"mimetype": "text/x-python",
"name": "python",
"nbconvert_exporter": "python",
"pygments_lexer": "ipython3",
"version": "3.6.4"
}
},
"nbformat": 4,
"nbformat_minor": 2
}