-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathgrafico_metadados.py
66 lines (50 loc) · 1.75 KB
/
grafico_metadados.py
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
# -*- coding: utf-8 -*-
"""
Created on Tue Nov 10 10:42:42 2020
@author: felip
"""
import pandas as pd
from scipy import stats
from sklearn.preprocessing import LabelEncoder
import seaborn as sns
import matplotlib.pyplot as plt
metadata = pd.read_csv('HAM10000_metadata.csv')
# armazena as sete classes do dataset na variável "le"
le = LabelEncoder()
le.fit(metadata['dx'])
LabelEncoder()
# printa todas as classes
print("Classes:", list(le.classes_))
metadata['label'] = le.transform(metadata["dx"])
metadata.sample(10)
#define o tamanho da figura
fig = plt.figure(figsize=(40,25))
#faz um gráfico referente ao tipo de cada cancer
#posição do gráfico
ax1 = fig.add_subplot(221)
#valida as informações do campo "dx", referente aos tipos de cancer, no arquivo de metadados
# também valida o tipo do gráfico, no caso, de barra
metadata['dx'].value_counts().plot(kind='bar', ax=ax1)
#informa o titulo das informações no eixo Y
ax1.set_ylabel('Contagem', size=50)
#informa o titulo do gráfico
ax1.set_title('Tipo de cancer', size = 50)
#faz um gráfico referente a cada sexo
ax2 = fig.add_subplot(222)
metadata['sex'].value_counts().plot(kind='bar', ax=ax2)
ax2.set_ylabel('Contagem', size=50)
ax2.set_title('Sexo', size=50);
#faz um gráfico referente a cada local do corpo
ax3 = fig.add_subplot(223)
metadata['localization'].value_counts().plot(kind='bar')
ax3.set_ylabel('Contagem', size=50)
ax3.set_title('Local do corpo', size=50)
#faz um gráfico referente a idade das pessoas das imagens de cancer
ax4 = fig.add_subplot(224)
sample_age = metadata[pd.notnull(metadata['age'])]
sns.distplot(sample_age['age'], fit=stats.norm, color='red');
ax4.set_title('Idade', size = 50)
ax4.set_xlabel('Ano', size=50)
# mostra o grafico
plt.tight_layout()
plt.show()