A BDletter está de cara nova e com ainda mais conteúdo, confira:
Na nova seção “Uma boa pergunta”, você confere em primeira mão quais dados estão chegando em nosso datalake público, sempre com uma análise completa antes de chegar em nossas redes sociais.
Outra novidade é a seção“Trocando dados”, na qual trazemos uma conversa exclusiva com um(a) convidado(a) especial.
Além de informar sobre todas as novidades da BD, nossa newsletter agora também traz dicas sobre como facilitar ainda mais seu trabalho com dados, eventos, análises e conteúdos interessantes de nossos usuários.
Se você já gostava da BDletter, temos certeza de que irá curtir ainda mais agora. Que tal nos ajudar recomendando para um(a) amigo(a)? É só mandar o link para ele(a) assinar também.
📊 Uma boa pergunta
Como é o desempenho das escolas do Ceará em matemática?
A garotada da escola Estadual João. E da Cruz deu um baile na prova do Sistema de Avaliação da Educação Básica (Saeb), alcançando a maior nota do estado. Aliás, o município de Cruz teve um ótimo desempenho e o Ceará foi um destaque na taxa de crescimento da avaliação. Essas e muitas outras informações estão muito mais fáceis de serem acessadas e analisadas agora pela BD.
O Saeb é um importante conjunto de avaliações, realizadas pelo Inep, para diagnosticar a educação básica brasileira e identificar fatores que podem interferir no desempenho dos estudantes. Você já pode usar uma consulta SQL, R, Python ou Stata para acessar microdados das avaliações e do abrangente questionário socioeconômico aplicados para os alunos do Ensino Fundamental, tudo através do nosso datalake público. Nossa equipe de dados ainda preparou uma série temporal com a nota de proficiência de todos os alunos, com todas as disciplinas, desde 1995 até 2019.
Para essa visualização, usamos um coringa na manga: os dados do geobr, disponíveis também na BD. Esse conjunto possui uma ampla variedade de dados geográficos, em várias escalas geográficas e para diferentes temas. Neste exemplo, conectamos a base através do id_escola. Em suas análises espaciais, você também consegue fazer essa conexão mais facilmente aproveitando diversas tabelas do nosso datalake público.
Vale lembrar que todos os códigos utilizados para produção das visualizações e gráficos da BD estão disponíveis em nosso repositório de análises no GitHub.
Você também tem uma boa pergunta? Mande para nós através das redes sociais, quem sabe você não encontra ela aqui na próxima edição!
Junho foi mês de muito orgulho e celebração para a comunidade LGBTQIA+, mas também de conscientização quanto aos desafios que essa parcela da população enfrenta. Dentre eles, está a subnotificação de dados importantes para elaboração de políticas públicas eficazes e que beneficiem a comunidade.
Falamos sobre esse tema com o Marcos Felipe Lopes, Líder de Pesquisa e Desenvolvimento na TODXS, organização sem fins lucrativos que promove a inclusão com iniciativas de formação de lideranças, pesquisa, conscientização e segurança. Preparamos também um artigo com 5 iniciativas que coletam e sistematizam dados sobre a comunidade.
Você acredita que existe uma subnotificação de dados sobre a comunidade LGBTQIA+?
"Acredito que há, sim, subnotificação de dados, especialmente porque muitas pessoas não se identificam abertamente como LGBTI+, assim todos levantamentos de dados encontrarão esse entrave. Esse cenário ficou evidente nos resultados da Pesquisa Nacional de Saúde recentemente publicados pelo IBGE, já que o número de pessoas que se recusaram a responder (2,3%) foi maior do que aquelas que se declararam como homossexuais, bissexuais ou outra orientação sexual (2%). Esse dado acende um alerta com relação à insegurança que a pessoa pode sentir ao responder a pesquisa. O IBGE informou que tomou medidas para garantir a privacidade, como o autopreenchimento da questão, porém o próprio Instituto indicou que o preenchimento foi feito pelo entrevistador na maior parte dos casos."
Como funciona esse trabalho de coleta e disponibilização de dados sobre a comunidade LGBTQIA+ na TODXS?
"A TODXS possui uma área de Pesquisa, que se dedica à produção e divulgação de informações sobre e para a população LGBTI+. Um dos nossos principais projetos é a Pesquisa Nacional por Amostra da População LGBTI+, que consiste em um levantamento por questionário com mais de 100 perguntas, aplicado em 2019 de forma virtual para pessoas LGBTI+ residentes nas capitais brasileiras. Tivemos mais de 30 mil pessoas respondentes e, após a validação dos dados com base em alguns critérios, fechamos a amostra com 15.326 respostas. Os relatórios e demais trabalhos de pesquisa publicados pela TODXS podem ser conferidosna seção biblioteca do nosso site aqui."
💡 Pra ficar ainda mais fácil
Nossa base deDiretórios Brasileiros existe para facilitar – e muito – a sua análise. Ela deixa mais prático o cruzamento de diferentes conjuntos criando relações entre entidades, como UF, município, escola, distrito, setor censitário e mais.
Veja um exemplo: Ao analisar o tempo médio de deslocamento em diferentes cidades do Brasil, podemos usar a base de Diretórios Brasileiros para adicionar as colunas com o nome do estado e do município. Para fazer isso, cruzamos a tabela municipio, da base de Diretórios, com a tabela tempo_deslocamento_casa_trabalho, da base de Indicadores de Mobilidade e Transporte, usando a coluna id_municipio como chave primária.
Confira a seguir a consulta e o resultado:
📌 O que rolou esse mês
#BD20k | Chegamos a 20 mil seguidores no Twitter e, para comemorar a ocasião, lançamos um desafio para nossa comunidade: encontrar o número 20.000 em resultados de consultas com dados da BD. Veja alguns dos exemplos e consultas aqui.
Vaga de Analista de Captação | Nossa equipe não para de crescer e uma das nossas necessidades é conseguir recursos. Por isso, estamos buscando alguém para nos ajudar a mapear novas oportunidades de negócios e parcerias como editais, dialogar com possíveis clientes, realizar relatórios de atividades, atrair e gerenciar grandes doadores, dentre outras atividades. Você pode ver mais detalhes da vaga aqui.
Capacitação de futuros gestores públicos | Em uma parceria inédita com o Vetor Brasil, ONG que capacita profissionais para atuar na administração pública e faz pareamento entre candidatos e vagas pelo Brasil, criamos um curso para transmitir conhecimentos básicos e intermediários de conceitos e aplicações de análise de dados, com o uso de tabelas e linguagem SQL. A ideia foi proporcionar aos alunos do Vetor um contato inicial com a exploração de dados públicos. Você pode conferir detalhes da parceria por aqui.
Transparência | Está no ar nossa nova página de Transparência, onde você encontra os dados da contabilidade da BD, como receitas e despesas, nosso indicador de sobrevida, estatuto institucional e relatório de atividades. E tem mais! Também disponibilizamos os microdados relativos à contabilidade da organização em nosso datalake público. Veja mais.
📡 No radar
Painel FGV | Estamos hoje (12 de julho) no painel “Dados Abertos contra Dados Pessoais - Compatibilizando transparência pública e proteção de dados” da CPDP (Computers, Privacy and Data Protection Conference), plataforma latino-americana para discussão sobre privacidade, proteção de dados e tecnologia. Dividimos espaço com muita gente incrível para debater o tema. Veja mais.
Python Brasil 2022 | Estão abertas as submissões de palestras para a maior conferência sobre linguagem de programação Python do Brasil e da América Latina. Serão 6 dias de imersão, em que os participantes poderão contribuir para projetos de software livre, participar de treinamentos e adquirir novos conhecimentos com desenvolvedores renomados da comunidade. Você pode submeter sua palestra por aqui.
CODA amazônia | O principal evento de jornalismo de dados e inovação da América Latina terá edição regional na Amazônia, com uma programação inteiramente presencial e 2 painéis com convidados internacionais. O evento acontece nos dias 27 e 28 de julho, em Belém (PA), e você já pode se inscrever por aqui.
🌎 Databasers
Victor Farias, jornalista de dados no G1, usou a base Nomes do Brasil, com dados do IBGE, para criar o ranking “ O meu também é Betty”, uma calculadora que diz o quão popular seu nome é no Brasil. E aí, seu nome é pop ou é flop?