O uso do R para fazer uma análise do Censo da Educação Superior

R Markdown Gestão Pública Censo Educação Superior UNIRIO

Introdução

Diversos professores e alunos já me perguntaram quantos alunos estão na Universidade. Lembro que eu não consegui responder rapidamente a essa pergunta. Todavia, com uma maior experiencia com o R e com acesso aos dados do inep já podemos responder a essa pergunta.

Neste artigo vamos descobrir quantos alunos a UNIRIO tem. Mais do que isso, vamos ver o perfil do aluno. Paraa isso, temos que acessar os microdados do INEP e fazer um filtro para os alunos da Unirio. Felizmente, o DATAUNIRIO já fez isso e colocou a base de dados da UNIRIO para download. Logo, neste tutorial, vamos aprender a usar o R para fazer uma análise sobre a Universidade.

A base de dados está no formato RDS e pode ser baixada do repositório de dados do DATAUNIRIO. Para carregar a base de dados no R precisamos utilizar o código abaixo.

Carregando a Base de Dados

Já com o download da base de dados, podemos importar para o R com o comando:

readRDS(nomedabasededados)

Com a base de dados importada para o R, podemos verificar quantos alunos a UNIRIO tem (de acordo com o INEP)

Quantos alunos a UNIRIO tem?

[1] “
" [1] “Total de Alunos: 18960” [1] “

"
Para fazer isso no R, precisamos executar os comandos: nrow(ALUNO_UNIRIO16) ou dim(ALUNO_UNIRIO16)

De acordo com o INEP, a UNIRIO tem quase 19 mil alunxs.

Qual o curso da Universidade mais frequentado?

Para saber quais são as variáveis que o INEP disponibiliza sobre a UNIRIO, precisamos executar o comando:names(ALUNO_UNIRIO16). Outros comandos interessantes são str(ALUNO_UNIRIO16) e head(ALUNO_UNIRIO16)

Após esta etapa, você pode escolher uma variável para fazer análise, ou seja, uma variável de interesse. (escolhi verficar quantos alunos temos em cada curso). Para fazer esta etapa, podemos usar o comando table. Esta função é aplicada na base de dados ALUNO_UNIRIO16 e na variável NO_CURSO. Desse modo, temos:

Qual a cor declarada pelos alunos da UNIRIO?

Podemos fazer tantas perguntas para a base de dados quanto quiser. Por exemplo, qual a cor autodeclarada pelos alunos da Universidade?

Para responder a essa pergunta, vamos fazer uma visualização da tabela. Em primeiro lugar, vamos criar o mesmo código que o anterior, mas vamos utiliza-lo na variável DS_COR_RACA_ALUNO (Descrição da Cor/Raça do Aluno). Depois vamos “guarda” essa tabela em um objeto chamado tabela1. Após esse comando, vamos gerar o gráfico. O nome desse gráfico é mosaíco (em inglês, mosaicplot). Para ver o código em R, clique em Code.

Qual a situação dos alunos da UNIRIO?

Uma variável que parece ser interessante é a situação dos alunos da Universidade. Nela podemos ver que 19,16% dos alunos tem a matrícula trancada. Isto quer dizer que um em cada cinco alunos trancada.

[1] “
" [1] “Percentual de Matrículas Trancadas: 19.16” [1] “

"

Outros dois aspectos interessantes sobre a universidade são a Modalidade de Ensino e Grau Acadêmico. Eles podem ser vistos nos gráficos abaixo.

Mapa da Origem do Aluno da Universidade

Além disso, podemos ver o estado de origem dos alunos da Universidade. Como previsto a grande maioria é do Rio de Janeiro. Interessante notar que existe 517 alunxs que vieram de São Paulo.

Existem diversas outras análises possíveis. Encontre a sua!