Professional Documents
Culture Documents
np_est_peso=numpy.array([[1.68,1.87,1.75,1.57,1.66,1.78,1.97,1.75,1.67,1.60],[80,55,85,80,67,88
,120,85,95,77]])
print(np_est_peso[1:,2:])
np_est_imc=numpy.array([["Manuel","Rafael","Patricia","Amparito","Luis","Miguel","Rafa","Paty"
,"Amparo","Luis"],num_imc])
print(np_est_imc)
print(' NOMBRES TALLAS PESOS (kG) IMC (Kg/m^2) CON SOBREPESO?')
for i in range(len(num_nom)):
print(num_nom[i],' ',estaturas[i],' ',num_pesos[i],' ',num_imc[i],' ',num_sobrepeso[i])
print(np_est_imc[1:,2:]
fam=["Manuel",1.78,"Rafa",1.87,"Paty",1.75,"Amparo",1.67,"Luis",1.60]
print(fam)
print(fam[-1])
print(fam[2:8])
print(fam[2:1])
print(fam[2:])
print(fam[:3])
print(type(fam))
fam2=[["Miguel",1.78],["Juanita",1.50],["Amparo",1.67],["Lunita",1.58],["Pedro",1.68],["Juanita",1
.50],["Alexander",1.77],["Luis",1.60]]
print(fam2)
print(fam2[-1])
print(fam2[2:8])
print(fam2[2:1])
print(fam2[2:])
print(fam2[:3])
for f in sorted(set(fam)):
print f
print(len(fam2))
print(fam2)
del(fam2[3])
print(fam2)
fam3=["Miguel",1.78,"Rafa",1.87,"Paty",1.75,"Amparo",1.67,"Luis",1.60]
fam4=[fam2+["Pipe",1.45],["Joselo",1.95]]
print(fam4)
print(len(fam4))
print(fam.index("Rafa"))
El siguiente ejemplo ilustra la manera de calcular datos almacenados en un archivo *.txt.
import numpy as np
import matplotlib as mpl
mpl.use('Agg')
import matplotlib.pyplot as plt
anos=np.loadtxt('anos.txt',delimiter=',',skiprows=1)
poblacion=np.loadtxt('poblacion.txt',delimiter=',',skiprows=1)
print(anos)
plt.hist(anos,bins=3)
print(poblacion)
matriz=np.loadtxt('anos.txt',delimiter=',',skiprows=1,usecols=[0,20])
print(matriz)
num_anos=np.array(anos)
print(num_anos)
num_poblacion=np.array(poblacion)
print(num_poblacion)
#num_pob=plt.num_poblacion
#print(num_imc)
promedio = sum(poblacion)/len(poblacion)
print('El promedio es= ',np.mean(poblacion))
#print('El promedio es= ',promedio)
print('la mediana= ',np.median(poblacion))
print('la correlacion= ',np.corrcoef(poblacion))np.corrcoef(poblacion))
Este ejemplo ilustra la manera como se puede analizar gran cantidad de datos de una página
web (para este caso es https://datos.gov.co)
import pandas as pd
import matplotlib as mpl
mpl.use('Agg')
import matplotlib.pyplot as plt
datos=pd.read_csv("SaberBogota.csv")
print(datos.head(50))
datosResumidos=datos[['ESTU_EDAD','ESTU_GENERO','PUNT_C_NATURALES','PUNT_SOCIALES_CI
UDADANAS','PUNT_INGLES','PUNT_GLOBAL']]
print(datosResumidos.corr())
datosResumidos.plot.scatter('ESTU_EDAD','PUNT_GLOBAL') #Tipo de grafico y datos para el mismo
fig=plt.gcf() #Aplica el uso de la librería matplotlib para graficar
fig.savefig('scaterout.png') #Salva el gráfo del tipo png con el nombre scaterout
#datosResumidos.plot.scatter('PUNT_C_NATURALES','PUNT_INGLES')
#fig=plt.gcf()
#fig.savefig('outcni.png')
#datosResumidos.hist('ESTU_EDAD')#Para un histograma
#fig=plt.gcf()
#fig.savefig('histEdades.png')
#datosResumidos.hist('PUNT_GLOBAL')
#fig.savefig('histPuntajes.png')
#datosResumidos.boxplot('PUNT_GLOBAL')#Para uno de cajas y bigotes
#fig=plt.gcf()
#fig.savefig('boPuntadas.png')
#print('www.datos.gov.co')
import pandas as pd
import matplotlib as mpl
mpl.use('Agg')
import matplotlib.pyplot as plt
import numpy as np
nusers=['user_id','gender','age','ocupation','zip']
users=pd.read_table('users.dat',sep='::',header=None,names=nusers,engine='python')
#print(users.head(10))
#sentencia para leer desde el archivo
#print(users.head(10)) #print(users.tail(10))#Para ver los últimos diez
nratings=['user_id','movie_id','rating','timestamp']
ratings=pd.read_table('ratings.dat',sep='::',header=None,names=nratings,engine='python')
nmovies=['movie_id','title','genres']
movies=pd.read_table('movies.dat',sep='::',header=None,names=nmovies,engine='python')
#print(movies.head(10))
data=pd.merge(pd.merge(ratings,users),movies)
print(data.head(10))
mean_ratings=data.pivot_table('rating','title','gender',aggfunc='mean')
#print(mean_ratings.head())
print('---------------------------------------')
ratings_per_group=data.groupby('title').size()
print(ratings_per_group.head())
active_titles=ratings_per_group[ratings_per_group>=50]
print(active_titles.head())
mean_ratings=mean_ratings.ix[active_titles]
print(mean_ratings.head())
top_female=mean_ratings.sort_values(by='F',ascending=False)
print(top_female.head())
mean_ratings['diff']=mean_ratings['F']-mean_ratings['M']
print(mean_ratings['diff'].head())