Data ScienceMachine Learning

O que é R?

O que é R? – A cada minuto é criado uma quantidade gigantesca de dados. Mas apenas ter essa grande massa de dados não é o suficiente, é preciso transformá-los e organizá-los, para que possamos ter informações relevantes. Essa manipulação de dados é fundamental.

No meio dessas análises muitas vezes precisamos realizar procedimentos que acabam envolvendo matemática e estatística. Falando essas palavras pode até nos assustar um pouco, mas para nos ajudar temos uma linguagem que veio evoluindo e amadurecendo, tendo se popularizado muito neste meio. Fazendo com que diversas empresas passem a utilizá-la para aprimorar suas análises, a linguagem R.

R é uma linguagem e ambiente de desenvolvimento, sendo muito utilizada para a área matemática e estatística, sob a licença GNU. Quando dizemos que ele também é um ambiente de desenvolvimento, isso significa que o próprio programa funciona como ambiente que interpreta a linguagem. Fazendo com que tudo aconteça em tempo real.

Falando um pouco sobre sua criação, o R é uma linguagem que foi derivada do S (linguagem de programação estatística), lançada em 1993. Os criadores primeiramente tomaram a linguagem S como base para criar sua própria linguagem e ambiente, possuindo muito mais recursos. O nome “R” vem das iniciais de seus criadores, Ross Ihaka e Robert Gentleman. Sua utilização é totalmente gratuita, o que facilitou muito a adoção por quem a utiliza.

O que pode ser feito?

O R ajuda muito na análise de grandes conjuntos de dados, onde você pode aplicar modelos estatísticos e até importar/exportar para banco de dados relacionais. Vimos que seu propósito principal é em análises estatísticas, mas com a utilização da linguagem R você pode instruí-lo a fazer algo que ele não faça naturalmente, como análises mais complexas, por exemplo. Essa é uma das grandes vantagens de também ser uma linguagem de programação, pois você pode programar (ensinar) a fazer coisas novas.

Além disso, a possibilidade da criação de gráficos faz do R uma forte ferramenta de visualização, o que auxilia muito na visualização de dados de forma muito amigável. Você pode inclusive criar visualizações customizadas ao que você necessita, através de uma lista de pacotes que ele possui, onde você pode instalar e criar os gráficos customizados.

Por que aprender R?

Como pudemos ver, a linguagem R se popularizou muito neste meio. Se você se interessa pela área da ciência de dados, Big Data, Machine Learning, a linguagem R é uma das melhores ferramentas para isso, além de estar sendo uma das mais utilizadas.

É uma opção a mais para seu trabalho no dia a dia. Quanto mais ferramentas/linguagens você conhece e consegue utilizar, mais coisas você consegue resolver. Empresas gigantes como a Oracle e a Microsoft já integraram a linguagem R aos seus produtos de análise de dados, ou seja, se eles estão investindo nisso, é legal você começar a dar uma olhada também. Se você se interessou e não sabe por onde começar, temos um curso específico de R onde você pode conhecer um pouco mais e um outro mais focado no Machine Learning.

Leia também: “O que é Clean Architecture