1 R y RStudio

Las bases del desarrollo de R se remontan a los años 70 cuando en los laboratorios Bell se desarrollo S, un lenguaje de programación para realizar análisis estadísticos.
R es un lenguaje de programación orientado a objetos enfocado al análisis estadístico de una diversidad de datos. Sin embargo, las aplicaciones recientes de R incluyen desarrollo de inteligencia artificial y desarrollo web (Giorgi, Ceraolo, and Mercatelli 2022).

Historia del desarrollo de R. Tomada de (Giorgi, Ceraolo, and Mercatelli 2022)

Actualmente, R se encuentra alojado en la web dentro del repositorio CRAN (Comprehensive R Archive Network). Por default, R se instala con 14 paquetes base dentro de los cuales destacan base, compiler, datasets, graphics, stats, entre otros. Sin embargo en el repositorio CRAN se aloja el código para que descargues todos los paquetes que requieras para tus análisis.

1.2 Comunidades de R

El crecimiento de R como lenguaje de programación enfocado al análisis estadístico se debe a las comunidades de ususarios. Alrededor del mundo existen diferentes comunidades de usuarios con distintos niveles de manejo de R (desde nivel inicial hasta experto). Estas comunidades permiten a los usuarios interactuar entre ellos para la resolución de dudas, la publicación de tutoriales e incluso la organización de cursos y eventos (presenciales o en línea) para llevar a cabo el análisis de distintos tipos de datos.

  • R-project: Página oficial de R
  • Tidy Tuesday: Comunidad encargada de ublicar flujos de trabajo para la curación de bases de datos. Enfocada en los paquetes de tidyverse
  • R-Ladies: Comunidad enfocada en promover la equidad de género dentro del ámbito de la programación. Cuentan con una serie y programa de cursos para que personas (de todos los géneros) practiquen y mejoren sus habilidades en ciencia de datos
  • R-bloggers: Comunidad organizada en blog en donde se publican ejemplos de código, análisis de datos y visualización.

    ¿Dónde más puedo buscar ayuda? Existen comunidades de programadores especializados en otros lenguajes en Stackoverflow, BioStars y Bioconductor que resuelven problemas de código, intsalación de paquetes o análisis de datos en R para ciencia de datos o bioinformática, respectivamente.

    1.3 RStudio

    RStudio es una interfaz conocido como entorno de desarrollo integrado o IDE que nos permite interactuar con el lenguaje de programación R y ejecutar su código. Adicionalmente, RStudio permite a los usuarios escribir código para otros lenguajes de programación (python, C++, SQL, HTML). Para la instalación y uso de este IDE es necesario que previamente hayas instalado R en tu computadora. Actualmente existen dos maneras de utilizar RStudio:

  • Descargándolo directamente desde la página de PositCloud
  • Haciendo uso de la nubde de PositCloud
  • La ventaja de utilizar RStudio en la nube es que no requieres instalar ningún programa en tu computadora, solo necesitas crear una cuenta. Sin embargo, el plan básico solo te permite trabajar algunas horas y tiene un número límitado de tareas para procesar.
    Una vez que instales o abras RStudio en la nube visualizaras la ventana de RStudio. Esta ventana se conforma de 4 cuadrantes:

    Consola de RStudio. Se muestran los cuatro cuadrantes que componen la ventana de RStudio. Tomada de https://agricolamz.github.io/linguistic_geocomputation_in_r/introduction-to-r-language.html

    1. Editor de scripts. El cuadrante que tiene la función de escribir y redactar el código o scripts de nuestros programas. En este cuadrante los comandos NO se ejecutan de forma automática al presionar la tecla de Enter

    2. Consola de R. Es la consola o termnal en donde se está ejecutando el lenguaje R. Aquí los comandos escritos se ejecutan de manera automática al presionar la tecla de Enter

    3. Entorno de variables. En este cuadrante se almacenan o guardan las variables, funciones u objetos (listas, tablas,…) dervivados de los análisis

    4. Utilidades. Desde este cuadrante podemos accesar a los archivos de nuestra computadora en la pestaña de Files; gráficas generadas durante los análisis en la pestaña de Plots; lista e información de los paquetes instalados en la pestaña Packages; manuales de los programas instalados Help

    Desde el menú principal puedes crear, salvar o abrir un nuevo script. Asímismo, es posible buscar funciones, comandos u objetos dentro del script dando click en la lupa.

    Para realizar esta práctica es necesario que tengas instalado R y RStudio o bien generes una cuenta en Positcloud para hacer uso de la nube.

    Visita la página de PositCloud para descargar las cheatsheets disponibles para su consulta.

    Ejercicio 1
    Visita la siguiente liga y contesta el cuestionario

    2 Referencias

    Giorgi, Federico M., Carmine Ceraolo, and Daniele Mercatelli. 2022. “The R Language: An Engine for Bioinformatics and Data Science.” Life 12 (5): 648. https://doi.org/10.3390/life12050648.