DATA Science and AI, Del concepto al desarrollo
A. Manipulación de datos
1. Fundamentos de Python
Utilizar estatutos y estructuras de datos en Python que involucren ciclos y estatutos condicionales.
Key Concepts:
Ambientes de programación
Estructuras de datos
Estatutos condicionales
Estatutos de repetición
https://hugodelamora.wordpress.com/data-science-ai-from-concept-to-deploy-apps/
https://hugodelamora.wordpress.com/python-bigdata/
Sesión 1
Execution error
Google colab with all the Python Basic Stuff and a Planet Practice
https://colab.research.google.com/drive/1cXIb4KZGUH5WDY4-ggyOgoKC8mTf0kN9#scrollTo=Wk4EgWAqvYcv
Profundiza
Objetivos específicos
Reconocerás y seleccionarás los estándares en Python pertinentes para utilizar en tu programa.
Definirás funciones en Python para desarrollar programas más concisos y modulares.
Crearás scripts en Python para manipular archivos cuando el problema así lo requiera.
Test
N/a
Sesión 2
https://colab.research.google.com/drive/1Xdf7bvrMt21Nal3lkh8EPm51yyc4HIdn#scrollTo=SBIMeOnXhjoN
Reto
2.Plataformas de aplicación sobre Python
Sesión 1
Name: numpy
Version: 1.21.5
Summary: NumPy is the fundamental package for array computing with Python.
Home-page: https://www.numpy.org
Author: Travis E. Oliphant et al.
Author-email: None
License: BSD
Location: /shared-libs/python3.7/py/lib/python3.7/site-packages
Requires:
Required-by: torchvision, thinc, tensorflow, tensorboard, spacy, seaborn, scipy, scikit-learn, pyarrow, pandas, opt-einsum, matplotlib, Keras-Preprocessing, h5py, folium, duckdb, datascience, bokeh, blis, altair
Requirement already satisfied: numpy in /shared-libs/python3.7/py/lib/python3.7/site-packages (1.21.5)
WARNING: You are using pip version 20.1.1; however, version 22.0.4 is available.
You should consider upgrading via the '/root/venv/bin/python -m pip install --upgrade pip' command.
Profundiza
Objetivos específicos
Recordarás cuáles son las operaciones fundamentales en NumPy y Pandas.
Reconocerás adecuadamente cómo seleccionar información específica y cómo realizar cálculos para proporcionar resultados relevantes.
Crearás scripts en Python usando los frameworks NumPy y Pandas para recuperar información de diversas fuentes de datos.
https://colab.research.google.com/drive/1Szy3U2zCOQgsESouIXn3SdED0wU9VCwF#scrollTo=c02Q9zQgnb1A
Test
La instrucción para recuperar filas y columnas por medio de subíndices es iloc ya que loc no trabaja con subíndices.
Sesión 2
tweets
https://colab.research.google.com/drive/14wpS9VJ7wiUlvBuevicPV03J3pjA2AOa
vacunación
https://colab.research.google.com/drive/1ZcbJDFTOSsQjXe7ZNi97Nt9DC3hjkz9Z
Reto
https://colab.research.google.com/drive/1Imsk8GoTo90jTbqqAxQUuL1ngWa3oGgJ
Una columna derivada con el valor “on time” si cuando tuvo su última promoción tenía menos de 30 años. En caso contrario colocar el valor “out of time
3.Manipulación de datos en Python
Sesión 1
#df example, where, select, union (concat), join
0
nan
1
nan
2
name3
Execution error
Profundiza
Rdn matrix [[0.008703 0.19567565 0.95384809 0.84975184 0.64869118]
[0.09041115 0.53740134 0.18606369 0.66716616 0.91993888]
[0.26486398 0.10006891 0.2737874 0.85066144 0.81210045]
[0.25434883 0.35881842 0.07871891 0.31738102 0.57233853]]
Rdn [0.81388063 0.36355139 0.67714148 0.0030315 0.37608632]
edad
nombre
name1 1
name2 3
name3 3
##
name2 2
name1 1
name3 1
Name: nombre, dtype: int64
Test
NA
Sesión 2
Reto
https://colab.research.google.com/drive/1HtfbemLxCvh3UkWHs6vRq9wgTMgXBtrX?usp=sharing#scrollTo=L5wPHLbT7MsP
B. Visualización para Análisis Descriptivo e Inferencial y para Diseño de Aplicaciones Dashboard in Web
1. Plataformas de visualización
Sesión 1
https://colab.research.google.com/drive/1IzKUs7UmMSEQoVKFjLrGDZQZEnsoZTYu?usp=sharing#scrollTo=W6ZFcfb9buSJ