Skip to content

Commit

Permalink
Built site for gh-pages
Browse files Browse the repository at this point in the history
  • Loading branch information
Quarto GHA Workflow Runner committed Jan 12, 2024
1 parent b0ffae4 commit 2e1f8e8
Show file tree
Hide file tree
Showing 4 changed files with 85 additions and 58 deletions.
2 changes: 1 addition & 1 deletion .nojekyll
Original file line number Diff line number Diff line change
@@ -1 +1 @@
7da141ad
031d1f77
99 changes: 58 additions & 41 deletions 01-introduccion.html
Original file line number Diff line number Diff line change
Expand Up @@ -187,9 +187,10 @@ <h2 id="toc-title">Tabla de contenidos</h2>
<li><a href="#ejemplo-cálculos-renales" id="toc-ejemplo-cálculos-renales" class="nav-link" data-scroll-target="#ejemplo-cálculos-renales">Ejemplo (cálculos renales)</a></li>
<li><a href="#ejemplo-cálculos-renales-2" id="toc-ejemplo-cálculos-renales-2" class="nav-link" data-scroll-target="#ejemplo-cálculos-renales-2">Ejemplo (cálculos renales 2)</a></li>
</ul></li>
<li><a href="#modelos-y-procedimientos" id="toc-modelos-y-procedimientos" class="nav-link" data-scroll-target="#modelos-y-procedimientos"><span class="header-section-number">1.2</span> Modelos y procedimientos</a></li>
<li><a href="#proceso-de-modelación" id="toc-proceso-de-modelación" class="nav-link" data-scroll-target="#proceso-de-modelación"><span class="header-section-number">1.3</span> Proceso de modelación</a></li>
<li><a href="#análisis-como-proceso" id="toc-análisis-como-proceso" class="nav-link" data-scroll-target="#análisis-como-proceso"><span class="header-section-number">1.4</span> Análisis como proceso</a></li>
<li><a href="#diagramas-causales-1" id="toc-diagramas-causales-1" class="nav-link" data-scroll-target="#diagramas-causales-1">Diagramas causales</a></li>
<li><a href="#modelos-y-algoritmos" id="toc-modelos-y-algoritmos" class="nav-link" data-scroll-target="#modelos-y-algoritmos"><span class="header-section-number">1.2</span> Modelos y algoritmos</a></li>
<li><a href="#análisis-como-proceso" id="toc-análisis-como-proceso" class="nav-link" data-scroll-target="#análisis-como-proceso"><span class="header-section-number">1.3</span> Análisis como proceso</a></li>
<li><a href="#modelación-y-análisis-ingeniería" id="toc-modelación-y-análisis-ingeniería" class="nav-link" data-scroll-target="#modelación-y-análisis-ingeniería"><span class="header-section-number">1.4</span> Modelación y análisis: ingeniería</a></li>
</ul>
</nav>
</div>
Expand Down Expand Up @@ -229,7 +230,7 @@ <h2 data-number="1.1" class="anchored" data-anchor-id="diagramas-causales"><span
<i class="callout-icon"></i>
</div>
<div class="callout-title-container flex-fill">
Nota
Causas y mecanismos
</div>
</div>
<div class="callout-body-container callout-body">
Expand Down Expand Up @@ -275,48 +276,48 @@ <h3 class="unnumbered anchored" data-anchor-id="ejemplo-cálculos-renales">Ejemp
<td style="text-align: left;">mejora</td>
</tr>
<tr class="even">
<td style="text-align: left;">A</td>
<td style="text-align: left;">B</td>
<td style="text-align: left;">chicos</td>
<td style="text-align: left;">mejora</td>
</tr>
<tr class="odd">
<td style="text-align: left;">A</td>
<td style="text-align: left;">grandes</td>
<td style="text-align: left;">sin_mejora</td>
<td style="text-align: left;">mejora</td>
</tr>
<tr class="even">
<td style="text-align: left;">A</td>
<td style="text-align: left;">grandes</td>
<td style="text-align: left;">sin_mejora</td>
<td style="text-align: left;">B</td>
<td style="text-align: left;">chicos</td>
<td style="text-align: left;">mejora</td>
</tr>
<tr class="odd">
<td style="text-align: left;">A</td>
<td style="text-align: left;">grandes</td>
<td style="text-align: left;">B</td>
<td style="text-align: left;">chicos</td>
<td style="text-align: left;">mejora</td>
</tr>
<tr class="even">
<td style="text-align: left;">A</td>
<td style="text-align: left;">grandes</td>
<td style="text-align: left;">mejora</td>
<td style="text-align: left;">sin_mejora</td>
</tr>
<tr class="odd">
<td style="text-align: left;">A</td>
<td style="text-align: left;">grandes</td>
<td style="text-align: left;">mejora</td>
</tr>
<tr class="even">
<td style="text-align: left;">A</td>
<td style="text-align: left;">B</td>
<td style="text-align: left;">grandes</td>
<td style="text-align: left;">mejora</td>
</tr>
<tr class="odd">
<td style="text-align: left;">A</td>
<td style="text-align: left;">grandes</td>
<td style="text-align: left;">sin_mejora</td>
<td style="text-align: left;">mejora</td>
</tr>
<tr class="even">
<td style="text-align: left;">B</td>
<td style="text-align: left;">grandes</td>
<td style="text-align: left;">chicos</td>
<td style="text-align: left;">mejora</td>
</tr>
</tbody>
Expand Down Expand Up @@ -561,8 +562,8 @@ <h3 class="unnumbered anchored" data-anchor-id="ejemplo-cálculos-renales">Ejemp
<span id="cb8-14"><a href="#cb8-14" aria-hidden="true" tabindex="-1"></a><span class="st">"</span>, <span class="at">width =</span> <span class="dv">200</span>, <span class="at">height =</span> <span class="dv">50</span>)</span></code><button title="Copiar al portapapeles" class="code-copy-button"><i class="bi"></i></button></pre></div>
</details>
<div class="cell-output-display">
<div id="htmlwidget-9de5cb27b348068c6b79" style="width:100%;height:162px;" class="grViz html-widget"></div>
<script type="application/json" data-for="htmlwidget-9de5cb27b348068c6b79">{"x":{"diagram":"\ndigraph {\n graph [ranksep = 0.2]\n node [shape=plaintext]\n T \n M \n C\n edge [minlen = 3]\n T -> M\n C -> T\n C -> M\n{ rank = same; M; T }\n}\n","config":{"engine":"dot","options":null}},"evals":[],"jsHooks":[]}</script>
<div id="htmlwidget-cb9db5b724fbaec80b41" style="width:100%;height:162px;" class="grViz html-widget"></div>
<script type="application/json" data-for="htmlwidget-cb9db5b724fbaec80b41">{"x":{"diagram":"\ndigraph {\n graph [ranksep = 0.2]\n node [shape=plaintext]\n T \n M \n C\n edge [minlen = 3]\n T -> M\n C -> T\n C -> M\n{ rank = same; M; T }\n}\n","config":{"engine":"dot","options":null}},"evals":[],"jsHooks":[]}</script>
</div>
</div>
<p>Es decir, el tamaño de los cálculos es una causa común de tratamiento (T) y resultado (M). Veremos más adelante que la decisión de condicionar a el tipo de cálculos proviene de un análisis relativamente simple de este diagrama causal, independientemente de los métodos que usemos para estimar las proporciones de interés (en este ejemplo, examinar las tablas cruzadas es equivalente a hacer estimaciones de máxima verosimlitud).</p>
Expand Down Expand Up @@ -679,20 +680,23 @@ <h3 class="unnumbered anchored" data-anchor-id="ejemplo-cálculos-renales-2">Eje
<span id="cb11-14"><a href="#cb11-14" aria-hidden="true" tabindex="-1"></a><span class="st">"</span>, <span class="at">width =</span> <span class="dv">200</span>, <span class="at">height =</span> <span class="dv">50</span>)</span></code><button title="Copiar al portapapeles" class="code-copy-button"><i class="bi"></i></button></pre></div>
</details>
<div class="cell-output-display">
<div id="htmlwidget-d145c812283d9ed75c0c" style="width:100%;height:162px;" class="grViz html-widget"></div>
<script type="application/json" data-for="htmlwidget-d145c812283d9ed75c0c">{"x":{"diagram":"\ndigraph {\n graph [ranksep = 0.2]\n node [shape=plaintext]\n P\n T \n M \n edge [minlen = 3]\n T -> P\n P -> M\n T -> M\n{ rank = same; M; T}\n}\n","config":{"engine":"dot","options":null}},"evals":[],"jsHooks":[]}</script>
<div id="htmlwidget-fd3c1752a9127f5ddd10" style="width:100%;height:162px;" class="grViz html-widget"></div>
<script type="application/json" data-for="htmlwidget-fd3c1752a9127f5ddd10">{"x":{"diagram":"\ndigraph {\n graph [ranksep = 0.2]\n node [shape=plaintext]\n P\n T \n M \n edge [minlen = 3]\n T -> P\n P -> M\n T -> M\n{ rank = same; M; T}\n}\n","config":{"engine":"dot","options":null}},"evals":[],"jsHooks":[]}</script>
</div>
</div>
<p>Nótese que el análisis más apropiado no está en los datos: en ambos casos la tabla de datos es exactamente la misma. Los supuestos acerca del proceso que genera los datos sin embargo nos lleva a respuestas opuestas.</p>
<hr>
</section>
</section>
<section id="diagramas-causales-1" class="level2 unnumbered">
<h2 class="unnumbered anchored" data-anchor-id="diagramas-causales-1">Diagramas causales</h2>
<p>Los diagramas de arriba se llaman DAGs (Gráficas dirigidas acíclicas), y no son generadas por datos observados, sino que codifican conocimiento acerca del fenómenos y los datos observados. Nos ayudan a (<span class="citation" data-cites="rethinking">McElreath (<a href="#ref-rethinking" role="doc-biblioref">2020</a>)</span>):</p>
<ul>
<li>Pensar claramente en términos científicos/de negocio acerca de nuestro problema</li>
<li>Expresar los supuestos que hacemos que soportan nuestro análisis</li>
<li>Entender qué podemos entender o explicar, sin hacer supuestos adicionales acerca de las relaciones particulares entre las variables.</li>
<li>Guiar el análisis para decidir que modelos o procedimientos usar para contestar preguntas de interés.</li>
</ul>
<p>Los DAGs se construyen con causas, no asociaciones. El pensamiento causal es útil siempre que queremos responder preguntas acerca de un fenómeno de interés. En particular nos asisten en :</p>
<p>Los DAGs se construyen con causas, e implican asociaciones observables, pero no se construyen con asociaciones simplemente. El pensamiento causal es útil siempre que queremos responder preguntas acerca de un fenómeno de interés. En particular nos asisten en :</p>
<section id="análisis-descriptivo" class="level4 unnumbered">
<h4 class="unnumbered anchored" data-anchor-id="análisis-descriptivo">Análisis descriptivo</h4>
<ol type="1">
Expand All @@ -703,38 +707,43 @@ <h4 class="unnumbered anchored" data-anchor-id="análisis-descriptivo">Análisis
<section id="inferencia-causal" class="level4 unnumbered">
<h4 class="unnumbered anchored" data-anchor-id="inferencia-causal">Inferencia causal</h4>
<ol type="1">
<li>En algunos casos, queremos saber consecuencias de una intervención sobre un sistema o proceso dados (por ejemplo, ¿cuántos accidentes graves habría si pusiéramos una multa por no usar cinturón de seguridad?). Esto requiere utilizar pensamiento causal.</li>
<li>También es usual necesitar pensar cómo serían las cosas si el pasado se hubiera desarrollado de manera distinta (por ejemplo, ¿cómo serían las ventas si no se hubiera gastado en publicidad?) en publicidad ?).</li>
<li><strong>Efectos de intervenciones</strong>: En algunos casos, queremos saber consecuencias de una intervención sobre un sistema o proceso dados (por ejemplo, ¿cuántos accidentes graves habría si pusiéramos una multa por no usar cinturón de seguridad?). Esto requiere utilizar pensamiento causal.</li>
<li><strong>Contrafactuales</strong>: También es usual necesitar pensar cómo serían las cosas si el pasado se hubiera desarrollado de manera distinta (por ejemplo, ¿cómo serían las ventas si no se hubiera gastado en publicidad?) en publicidad ?).</li>
</ol>
</section>
<section id="diseño-de-estudios-o-experimentos" class="level4 unnumbered">
<h4 class="unnumbered anchored" data-anchor-id="diseño-de-estudios-o-experimentos">Diseño de estudios o experimentos</h4>
<p>Si queremos recolectar datos acerca de un fenómeno particular (por ejemplo, ¿cómo debo seleccionar una muestra para medir orientación política de una población?), diseños eficientes requieren tener conocimiento de dominio acerca de las causas de las variables que nos interesa medir. Por ejemplo, si queremos tomar una muestra de casillas para estimar el resultado de una votación, deberíamos considerar variables geográficas como distrito electoral, grado de urbanización, etc.</p>
<ol type="1">
<li>Si queremos recolectar datos acerca de un fenómeno particular (por ejemplo, ¿cómo debo seleccionar una muestra para medir orientación política de una población?), diseños eficientes requieren tener conocimiento de dominio acerca de las causas de las variables que nos interesa medir. Por ejemplo, si queremos tomar una muestra de casillas para estimar el resultado de una votación, deberíamos considerar variables geográficas como distrito electoral, grado de urbanización, etc.</li>
</ol>
</section>
<section id="predicción" class="level4 unnumbered">
<h4 class="unnumbered anchored" data-anchor-id="predicción">Predicción</h4>
<ol type="1">
<li>Incluso en problemas de predicción, modelos útiles resultan de pensar en la estructura causal del problema. Ignorar estos aspectos puede llevar fácilmente a evaluación incorrecta del desempeño, filtración de datos, o modelos que no pueden implementarse en la práctica.</li>
</ol>
</section>
</section>
<section id="modelos-y-procedimientos" class="level2" data-number="1.2">
<h2 data-number="1.2" class="anchored" data-anchor-id="modelos-y-procedimientos"><span class="header-section-number">1.2</span> Modelos y procedimientos</h2>
<p>En muchos cursos introductorios de estadística se muestran distintos tipos de procedimientos, que aplican según el tipo de datos (por ejemplo, categóricos o numéricos, pareados, no pareados, etc), generalmente con el propósito de evaluar evidencia en contra de una hipótesis nula.</p>
<section id="modelos-y-algoritmos" class="level2" data-number="1.2">
<h2 data-number="1.2" class="anchored" data-anchor-id="modelos-y-algoritmos"><span class="header-section-number">1.2</span> Modelos y algoritmos</h2>
<p>En muchos cursos introductorios de estadística se muestran distintos tipos de procedimientos, que aplican según el tipo de datos (por ejemplo, categóricos o numéricos, pareados, no pareados, etc), generalmente con el propósito de evaluar evidencia en contra de una hipótesis nula. Por ejemplo, de <span class="citation" data-cites="rethinking">McElreath (<a href="#ref-rethinking" role="doc-biblioref">2020</a>)</span>:</p>
<div class="quarto-figure quarto-figure-center">
<figure class="figure">
<p><img src="./figuras/rethinking-flujo-golems.jpg" class="img-fluid figure-img"></p>
<figcaption class="figure-caption">Ejemplo de proceso de decisión para procedimientos estadísticos</figcaption>
</figure>
</div>
<p>Este enfoque puede ser confuso en un principio (¿cómo se relacionan todos estos procedimientos?), y también restringir nuestra capacidad para analizar datos: ¿qué hacemos cuando no se cumplen los supuestos de un procedimiento? Adicionalmente si no tenemos mucha experiencia, la manera en que fallan estas herramientas puede ser poco intuitiva y difícil de descubrir.</p>
<p>Adicionalmente, aunque son herramientas poderosas, no sustituyen el pensamiento científico o de proceso de negocios. Estas herramientas no generan hallazgos si no están acompañados de pensamiento causal.</p>
<p>Y aunque son herramientas poderosas, no sustituyen el pensamiento científico o de proceso de negocios. Estas herramientas no generan hallazgos si no están acompañados de pensamiento causal.</p>
<p>Buscamos entonces:</p>
<ol type="1">
<li>Dar herramientas (bayesianas) para analizar datos que son más flexibles, y se puedan adaptar a distintas situaciones.</li>
<li>Proponer un proceso para analizar datos, que sea más sistemático, robusto, y maneras de checar que el proceso es correcto o hace lo que pensamos que tiene qué hacer.</li>
<li>Ligar 1 y 2 con supuestos causales claros para proponer una interpretación sólida de nuestros resultados.</li>
<li>Dar herramientas (bayesianas) para analizar datos que son más <strong>flexibles</strong>, y se puedan <strong>adaptar</strong> a distintas situaciones.</li>
<li>Proponer un proceso para analizar datos, que sea más <strong>sistemático</strong>, robusto, y maneras de checar que el proceso es correcto o hace lo que pensamos que tiene qué hacer.</li>
<li>Ligar 1 y 2 con supuestos causales claros para proponer una <strong>interpretación</strong> sólida de nuestros resultados.</li>
</ol>
</section>
<section id="proceso-de-modelación" class="level2" data-number="1.3">
<h2 data-number="1.3" class="anchored" data-anchor-id="proceso-de-modelación"><span class="header-section-number">1.3</span> Proceso de modelación</h2>
<p>El proceso de modelación que propondremos es bayesiano, y propondremos varios pasos para analizar datos:</p>
<ul>
<li><p>Análisis como <em>software</em>: Una parte de este proceso está relacionado con la reproducibilidad y documentación del trabajo, y su objetivo es evitar errores de programación y de organización (esta parte hablaremos menos: es necesario seguir los estándares de la industria para obtener resultados más confiables).</p></li>
<li><p>Otra parte es el proceso con el cual construimos y contrastamos modelos para contestar preguntas, verificamos los modelos y sus respuestas y checamos resultados de cómputos.</p></li>
</ul>
</section>
<section id="análisis-como-proceso" class="level2" data-number="1.4">
<h2 data-number="1.4" class="anchored" data-anchor-id="análisis-como-proceso"><span class="header-section-number">1.4</span> Análisis como proceso</h2>
<section id="análisis-como-proceso" class="level2" data-number="1.3">
<h2 data-number="1.3" class="anchored" data-anchor-id="análisis-como-proceso"><span class="header-section-number">1.3</span> Análisis como proceso</h2>
<p>Iremos refinando nuestro poco a poco, conforme veamos distintas herramientas y problemas. El más básico es el siguiente (<span class="citation" data-cites="rethinking">McElreath (<a href="#ref-rethinking" role="doc-biblioref">2020</a>)</span>):</p>
<ol type="1">
<li>Definir un modelo generativo para la muestra de datos.</li>
Expand All @@ -752,6 +761,14 @@ <h2 data-number="1.4" class="anchored" data-anchor-id="análisis-como-proceso"><
<figcaption class="figure-caption">Gelman et al, Bayesian Workflow</figcaption>
</figure>
</div>
</section>
<section id="modelación-y-análisis-ingeniería" class="level2" data-number="1.4">
<h2 data-number="1.4" class="anchored" data-anchor-id="modelación-y-análisis-ingeniería"><span class="header-section-number">1.4</span> Modelación y análisis: ingeniería</h2>
<p>Cualquier proceso de análisis de datos se beneficia de muchos aspectos de ingenería de software. Parte de la profesionalización del análisis de datos que observamos en ciencia de datos es utilizar las herramientas reconocidas para resolver problemas de desarrollo y calidad de código, así como su documentación.</p>
<ul>
<li><p>Análisis como <em>software</em>: Una parte de este proceso está relacionado con la reproducibilidad y documentación del trabajo, y su objetivo es evitar errores de programación y de organización (esta parte hablaremos menos: es necesario seguir los estándares de la industria para obtener resultados más confiables).</p></li>
<li><p>Otra parte es el proceso con el cual construimos y contrastamos modelos para contestar preguntas, verificamos los modelos y sus respuestas y checamos resultados de cómputos.</p></li>
</ul>


<div id="refs" class="references csl-bib-body hanging-indent" role="list">
Expand Down
Loading

0 comments on commit 2e1f8e8

Please sign in to comment.