FECHAS:

Agosto 2024 – Junio 2025

🕑 DURACIÓN:

424 hs. – 1 año

💻 MODALIDAD:

Virtual

💻 INSCRIPCIÓN:

Julio 2024

– Promover una propuesta de formación integral vinculada al campo de las ciencias de datos.
– Contribuir al trabajo disciplinar en el campo de las ciencias sociales en general, y específicamente en relación a lo computacional; para promover el desarrollo científico y social vinculados a los campos de las tecnologías, metodologías y datos.
– Brindar una formación del mejor nivel académico, científico y profesional a través de un cuerpo de profesores con un perfil universitario y profesional relevante.

La modalidad de la cursada será virtual con intercambio de información a través del Campus oficial de la Universidad Nacional Guillermo Brown.

Se dictarán 2 encuentros semanales sincrónicos en el horario de 18:30 a 21:30hs. Los días martes y jueves 

Coordinador académico:

Martín Iván Schuster
MSc Business Analytics (UCL)
Licenciado en Sociología (UBA)
 
Cuerpo docente:

Julián Ansaldo
Licenciado en Economía (UBA)

Clara Calí Mella
Master in Management and Analytics (UTDT)
Licenciada en Filosofía (UBA)

Joaquín Carrascosa
Doctor en Ciencias Sociales (UBA)
Magíster en Investigación en Ciencias Sociales (UBA)
Licenciado en Sociología (UBA)

Sebastián Frittaoni
Maestrando en Explotación de Datos y Descubrimiento del Conocimiento (UBA)
Licenciado en Sociología (UBA)

Bárbara Estévez Leston
Doctora en Ciencias Sociales (UBA)
Magíster en Investigación en Ciencias Sociales (UBA)
Licenciada en Sociología (UBA)

Florencia Ludueña
Magíster en Ciencia de Datos (UdeSA)
Licenciada en Economía (UBA)

Paula Luvini
Magíster en Ciencia de Datos (UdeSA)
Licenciada en Economía (UBA)

Renzo Polo
Maestría en Minería de Datos (UTN)
Ingeniero en Agrimensura (UNL)

Renzo Polo
Maestría en Minería de Datos (UTN)
Ingeniero en Agrimensura (UNL)

Metodología de la Investigación en Ciencias Sociales

Formulación de objetivos e hipótesis, enfatizando la importancia de definir metas claras e hipótesis testables para guiar el estudio. Desarrollo de estrategias teórico-metodológicas, donde se introduce a los estudiantes en diferentes paradigmas teóricos y cómo estos influyen en la elección de métodos de investigación. Identificación de diversas fuentes de datos, enseñando cómo seleccionar y evaluar tanto fuentes primarias como secundarias. Profundización en los procesos de medición y operacionalización, presentando técnicas para medir variables y conceptos y convertirlos en datos analizables. Universo y muestra, de estudio y selección de una muestra representativa. Importancia de definir y seleccionar la unidad de análisis adecuada para la investigación. Introduce a los estudiantes en la estadística descriptiva e inferencial, proporcionando las bases para el análisis de datos.

 

Fundamentos de Programación

Introducción al pensamiento computacional aplicado a las ciencias sociales. Introducción a lenguajes de programación. Lógica, algoritmos y secuencialidad. Sintaxis de un programa. Introducción a Python. Variables. Tipos y colecciones de datos.  Estructuración de código. Funciones nativas y propias. Estructuras de control condicional, iterativa y manejo de errores. Librerías y paquetes. Tipos de archivos. Introducción a la librería NumPy para operaciones matemáticas. Uso de librería Pandas para la manipulación de datos. Normalización y limpieza de datos con Pandas.

Introducción a Métodos Cuantitativos en Ciencias Sociales

Este módulo se centra en el estudio de diferentes tipos de variables y cómo estas pueden estar relacionadas de manera bivariada o multivariada. Abordaje del control de variables y las pruebas de hipótesis, proporcionando un marco para el análisis cuantitativo. Además, se exploran temas como la probabilidad, las chances, las correlaciones y la regresión lineal. Se introduce a los estudiantes en técnicas avanzadas como el Análisis de Varianza (ANOVA) y el Análisis Factorial, ofreciendo herramientas más sofisticadas para el análisis de datos.

Introducción a Modelado de Datos

Diversos tipos de modelos. Trade-offs precisión/interpretabilidad y sesgo/varianza.

Los modelos de regresión: repaso regresiones lineales simples, regresiones múltiples. Modelos de clasificación: regresiones logísticas, LDA y KNN. Cross-validation. La selección de modelos: lasso y ridge. Presentación de los Polinomiales: step, basis, splines. Utilización y uso de librería Scikit-learn para modelado de datos.

Bases de datos

Diseño de bases de datos. Principales enfoques de Datawarehouse (Kimball, Inmon). Bases de datos relacionales. Modelo entidad-relación. Principales operaciones en SQL (agregaciones, joins, grupos, transformación de datos).  Manejo de nulos. Vistas, vistas materializadas, CTEs y tablas. Principales bases de datos relacionales (mysql, postgresql). Uso de SQL desde Python (SQL Alchemy). Optimizaciones de bases de datos.   Modelado de datos no relacionales. Principales bases de datos no relacionales (MongoDB, Redis, Cassandra).

Introducción a Machine Learning

Este módulo ofrece una introducción completa al aprendizaje automático, abarcando tanto métodos supervisados como no supervisados. Se inicia con una visión general de qué es el aprendizaje automático y cómo se aplica en diferentes campos. Luego, se presentan técnicas específicas como los árboles de decisión, Random Forest y XGBoost, explicando cómo cada una de estas técnicas puede ser utilizada para resolver problemas específicos. Concepto de métodos de ensamble, que combinan múltiples modelos para mejorar el rendimiento. Abordaje del clustering o agrupamiento, que es una técnica de aprendizaje no supervisado. Finalmente, se discuten métodos para la evaluación de modelos, incluyendo métricas como la precisión, el recall y la curva ROC, para asegurar que los modelos generados sean tanto precisos como robustos.

Taller de Trabajo Final Integrador:

Este módulo se centra en la aplicación de los conocimientos adquiridos en la especialización a un problema concreto de Ciencias Sociales. Se espera que los estudiantes construyan uno o más modelos para investigar un problema específico de esta disciplina.

Seminarios optativos:

Visualización de Datos

El presente seminario desarrolla los diversos y variados principios de la visualización de datos. Estrategias de presentación y de visualización: librerías matplotlib y plotly, Tableau y PowerBI. La evaluación y el diseño de dashboards. El procesamiento y la narración de datos (storytelling). El diseño de gráficos efectivos. Análisis y uso de elementos visuales y herramientas de visualización de datos.

 

Procesamiento de Lenguaje Natural

Introducción al procesamiento de lenguaje natural. Principales aplicaciones en ciencias sociales. Trabajo con formatos textuales. Principales librerías de NLP. Tokenización de palabras. Stemming. Lematización. Stop Words. Part of Speech (PoS) y Named Entity Recognition. Clasificación de textos y palabras. Métricas de clasificación y matriz de confusión. Técnicas de Aprendizaje Supervisado y no supervisado aplicado a NLP. Análisis de Sentimiento y Semántico. Algoritmos de NLP. Topic Modeling: Latent Dirichlet Allocation (LDA) y Structural Topic Modeling (STM). Técnicas de visualización para análisis de NLP.

 

Sistemas de Información Geográfica

Introducción al tratamiento de información geográfica. Nociones básicas de data georreferenciada: sistemas cartesianos, sistemas proyectivos, Gauss Kruger, Utm. Cartografía digital. Datos geográficos. Definición y características. Componente espacial y temático. Capas. Modelo raster y vectorial. Tipos de datos geográficos utilizados en el análisis de datos: líneas, puntos y polígonos. Análisis urbano y territorial. Inteligencia territorial. Introducción a la estadística espacial. Dependencia espacial y autocorrelación. Modelado de información de comportamiento humano en el territorio. Cartografía y utilización de fuentes nacionales. Infraestructura de Datos Espaciales. Introducción a software específico SIG y a librerías en los lenguajes de programación utilizados.

Herramientas para la gestión de datos

Introducción a git. Principales comandos de git. Creación, gestión y documentación de repositorios. Introducción a infraestructura y pipelines de datos. Infraestructura de datos moderna y sus componentes. Conceptos datawarehouse, datalake, lakehouse. ETL. Gobernanza de Datos. Introducción a servicios de nube (AWS, G Cloud, Azure). Introducción a Airflow. Concepto de DAG y principales funcionalidad de Airflow.  Despliegue local de Airflow. Armado de un DAG mínimo.  Entornos virtuales. Testing. Linters y debugging. Github actions. Poetry. Documentación. Datahub. Introducción a APIs y web services.

1 pago de $480.000

DESCUENTOS |ESTUDIANTES UNAB 30%
Si sos alumno de la UNaB, tenés un descuento del 30% sobre el valor del curso.Deberás presentar tu certificado de Alumno regular obtenido a través del Siu Guaraní.

DESCUENTOS |ADMINISTRACIÓN PÚBLICA 20%
Si sos empleado de la Administración Pública , tenés un 20% de descuento sobre el valor total del curso. Deberás presentar una certificación laboral.

Bonificación 100% para afiliados Si.T.U.Na.B y ADUNaB

▶ Financiación en cuotas únicamente a través de Mercado Pago

Más información🡻

diplomaturas.sac@unab.edu.ar

✆ 11 2623-5417

Consultas de lunes a viernes de 8 a 15 hs sólo con mensajes escritos.

Más información🡻

diplomaturas.sac@unab.edu.ar

✆ 11 2623-5417

Consultas de lunes a viernes de 8 a 15 hs sólo con mensajes escritos.

 RECTORADO
Mitre 1399, Adrogué

 SEDE SOMELLERA
Somellera 648, Adrogué

 SEDE ESTEBAN ECHEVERRÍA
Av. Enrique Santamarina 311, Monte Grande

 CAMPUS
Blas Parera 132, Burzaco

  CONSULTAS
6064-4141


SEGUINOS