No se trata de cuál terminará venciendo al otro, sino en qué idioma debes concentrar principalmente tu tiempo y esfuerzo.
lengua moribunda. Excepto que más de la mitad de todos los científicos de datos utilizan ambos en su rutina diaria. ¿Pero por qué?
El ecosistema R es realmente poderoso
Nunca he sido un gran admirador de las estadísticas. Sé lo suficiente como para analizar datos perfectamente, pero cuando miro R y sus paquetes, me siento como un estudiante de posgrado que ve estadísticas básicas por primera vez. R tiene una larga tradición entre académicos y expertos en estadística. La gran cantidad de proyectos disponibles es impresionante. En este momento, CRAN, el repositorio de R más grande, tiene más de 12.000 paquetes que se están actualizando.
¿Necesita una prueba de Lavaan? ¡Tu entendiste! ¿Análisis factorial? Está ahí mismo en el paquete Psych. ¿Ecuaciones estructurales? Por favor, al menos intenta que sea un desafío. Tenga en cuenta que Python también tiene muchas de estas cosas implementadas, pero para las cosas realmente opacas, R todavía reina como rey.
Dado que la mayoría de los desarrolladores de R son académicos, la mayoría de estos paquetes están diseñados específicamente para resolver problemas académicos. Por ejemplo, Psych, ese paquete que mencioné anteriormente, está dirigido a psicólogos que trabajan en psicometría.
R es para ti si lo que buscas incluye:
- Funciones diseñadas para preparar datos para análisis específicos.
- Funciones listas para usar para realizar análisis e interpretar resultados.
- Funciones que crean gráficos personalizados para estos análisis.
- Todo ello sustentado en documentación basada en libros académicos,
La versatilidad de Python es inmejorable
Si R es el viejo pero confiable Mustang que tu padre compró cuando era adolescente, entonces Python es un Tesla elegante. Python se creó originalmente teniendo en cuenta la legibilidad para que pudiera actuar como puerta de entrada para nuevos programadores, y se nota. La sintaxis es fácil de usar e incluso un programador novato puede leer el código de un Pythonista (un desarrollador avanzado) y tener una idea general de lo que está haciendo.
Al ser Python un lenguaje multipropósito, es mucho más versátil que R, lo que lo convierte en el lenguaje ideal para la integración con otras plataformas. A modo de ejemplo, un colega mío está desarrollando actualmente un juego en Python que registra datos de toma de decisiones, los carga en un servidor donde se analizan y, finalmente, se cargará automáticamente en una página web para que otros científicos puedan echar un vistazo. en los datos.
Hace unos años, la mayoría de los científicos de datos habrían preferido R porque tenía un conjunto de herramientas más sólido para el aprendizaje automático. Pero ese ya no es más el caso. Python hoy iguala (y en ocasiones supera a R) como el mejor lenguaje para Inteligencia Artificial.
Python está creciendo a un ritmo gigantesco, y la razón principal es que el espacio de desarrollo (al menos para la ciencia de datos) se comparte entre programadores y científicos, por lo que hay personas con conocimientos teóricos trabajando codo con codo con personas con conocimientos técnicos. saber cómo.
Algunos críticos creen que es más difícil acceder a Python porque el ecosistema es muy grande. En mi experiencia, como científico de datos, sólo necesitas incursionar en una pequeña parte de las herramientas de Python e ir más allá a medida que exploras nuevas posibilidades. Para los nuevos científicos de datos, solo necesitan cinco bibliotecas: Numpy, Scikit-learn, Pandas, Scipy y Seaborn.
La mejor herramienta para ti
Un programador que quiera profundizar en la ciencia de datos debería comenzar con Python y luego experimentar con R cuando sea necesario, mientras que un académico puede sentirse más cómodo comenzando con R y luego pasar a Python a medida que ejecuta proyectos más grandes.
La mayoría de nosotros simplemente utilizamos uno u otro dependiendo de con qué nos sentimos cómodos y de lo que cada idioma puede ofrecer para resolver un problema. Los usuarios de Python pueden importar fácilmente funciones de R y viceversa.
No se trata de cuál terminará venciendo al otro, sino en qué idioma debes concentrar principalmente tu tiempo y esfuerzo. En mi humilde opinión, con la enorme expansión que estamos viendo con Python, encuentro muy pocas razones para decirle a alguien que comience con R. Pero aun así, cualquier científico de datos que valga un centavo debería tener un buen conocimiento de ambos lenguajes.
Si le gustó este artículo, consulte uno de nuestros otros artículos sobre Python.
- Python y Big Data, una tendencia actual
- ¿Es Python la herramienta adecuada para ayudar a su empresa a visualizar datos?
- Las 5 mejores bibliotecas de visualización de datos de Python
- Poesía de Python: un poema para la gestión de dependencias de Python
- ¿Cuáles son las habilidades necesarias para los desarrolladores de Python?