Não é uma questão de qual deles acabará vencendo o outro, mas sim em qual idioma você deve concentrar principalmente seu tempo e esforço.
linguagem moribunda. Exceto que mais da metade de todos os cientistas de dados usam ambos em sua rotina diária. Mas por que?
O ecossistema de R é realmente poderoso
Nunca fui muito fã de estatísticas. Eu sei o suficiente para analisar dados perfeitamente, mas quando dou uma olhada no R e seus pacotes, me sinto como um estudante de graduação vendo estatísticas 101 pela primeira vez. R tem uma longa tradição entre acadêmicos e especialistas em estatística. A enorme quantidade de projetos disponíveis é impressionante. No momento, o CRAN, o maior repositório do R, tem mais de 12.000 pacotes que estão sendo atualizados.
Precisa de um teste Lavaan? Você entendeu! Análise fatorial? Está bem ali no pacote Psych. Equações estruturais? Por favor, pelo menos tente fazer disso um desafio. Tenha em mente que o Python também tem muitas dessas coisas implementadas, mas para as coisas realmente opacas, R ainda reina como rei.
Como a maioria dos desenvolvedores R são acadêmicos, a maioria desses pacotes é projetada especificamente para resolver problemas acadêmicos. Por exemplo, Psych, aquele pacote que mencionei anteriormente, é voltado para psicólogos que trabalham com psicometria.
R é para você se o que você procura inclui:
- Funções projetadas para preparar os dados para análises específicas
- Funções prontas para executar a análise e interpretar os resultados
- Funções que criam gráficos personalizados para essas análises
- Tudo isso respaldado por documentação baseada em livros acadêmicos,
A versatilidade do Python é imbatível
Se R é o velho mas confiável Mustang que seu pai comprou quando era adolescente, então Python é um Tesla extravagante. Python foi originalmente construído com a legibilidade em mente para que pudesse atuar como uma porta de entrada para novos programadores, e isso fica evidente. A sintaxe é amigável e até mesmo um novo programador pode ler o código de um Pythonista (um desenvolvedor avançado) e ter uma ideia geral do que ele está fazendo.
Como Python é uma linguagem multifuncional, é muito mais versátil que R, o que a torna a linguagem ideal para integração com outras plataformas. Apenas como exemplo, um colega meu está atualmente desenvolvendo um jogo em Python que registra dados de tomada de decisão, carrega-os em um servidor onde são analisados e, eventualmente, será automaticamente carregado em uma página da web para que outros cientistas possam dar uma olhada no dados.
Há alguns anos, a maioria dos cientistas de dados teria preferido R, pois tinha um conjunto mais robusto de ferramentas para aprendizado de máquina. Mas esse não é mais o caso. Python hoje se iguala (e às vezes supera R) como a melhor linguagem para Inteligência Artificial.
Python está crescendo em um ritmo gigantesco, e o principal motivo é que o espaço do desenvolvedor (pelo menos para ciência de dados) é compartilhado entre programadores e cientistas, então você tem pessoas com conhecimento teórico trabalhando lado a lado com pessoas com conhecimento técnico. saber como.
Alguns críticos acreditam que é mais difícil entrar no Python porque o ecossistema é muito grande. Na minha experiência, como cientista de dados, você só precisa se envolver com uma pequena parte das ferramentas do Python e ir mais longe à medida que explora novas possibilidades. Para os novos cientistas de dados, você só precisa de cinco bibliotecas: Numpy, Scikit-learn, Pandas, Scipy e Seaborn.
A melhor ferramenta para você
Um programador que deseja se aprofundar na ciência de dados deve começar com python e depois mexer com R quando necessário, enquanto um acadêmico pode se sentir mais à vontade começando com R e depois passando para Python à medida que executa projetos maiores.
A maioria de nós simplesmente usa um ou outro, dependendo do que nos sentimos confortáveis e do que cada idioma pode oferecer para resolver um problema. Os usuários do Python podem importar funções R com facilidade e vice-versa.
Não é uma questão de qual deles acabará vencendo o outro, mas sim em qual idioma você deve concentrar principalmente seu tempo e esforço. Na minha humilde opinião, com a enorme expansão que estamos vendo com Python, encontro muito poucos motivos para dizer a alguém para começar com R. Mas, mesmo assim, qualquer cientista de dados que valha um centavo deveria ter um bom conhecimento de ambas as linguagens.
Se você gostou deste artigo, confira um de nossos outros artigos sobre Python.
- Python e Big Data, uma tendência atual
- Python é a ferramenta certa para ajudar sua empresa a visualizar dados?
- 5 melhores bibliotecas de visualização de dados Python
- Poesia Python: um poema para gerenciamento de dependências Python
- Quais são as habilidades necessárias para desenvolvedores Python?