Data Become

100 Fontes de Dados para Projetos de Engenharia e Ciência de Dados

A descoberta de fontes de dados é um dos primeiros e mais importantes passos em qualquer projeto de engenharia e ciência de dados. Encontrar conjuntos de dados de qualidade pode ser um desafio, especialmente para aqueles que estão começando.

Neste post, reunimos mais de 100 fontes de dados, disponibilizadas dentro de cada referência citada abaixo, que você pode usar em seus projetos. Esses conjuntos de dados abrangem uma ampla variedade de áreas, desde dados financeiros e econômicos até dados de saúde e ambientais. Esperamos que esta lista seja útil para suas próximas análises e modelos.

Índice

  1. Dados Governamentais
  2. Dados Financeiros e Econômicos
  3. Dados de Saúde
  4. Dados Ambientais
  5. Dados de Redes Sociais
  6. Dados Educacionais
  7. Dados de Transporte
  8. Dados de Imagens e Áudio
  9. Outros Dados

Dados Governamentais

  1. Data.gov
  • Um portal de dados abertos dos EUA com milhares de conjuntos de dados sobre vários tópicos.
  1. European Union Open Data Portal
  • Oferece acesso a dados públicos da União Europeia.
  1. Brazilian Open Data Portal
  • Portal de dados abertos do governo brasileiro.

Dados Financeiros e Econômicos

  1. Yahoo Finance
  • Oferece dados financeiros históricos e em tempo real.
  1. Quandl
  • Plataforma para dados financeiros e econômicos.
  1. World Bank Open Data
  • Dados econômicos e de desenvolvimento do Banco Mundial.

Dados de Saúde

  1. Kaggle: Health Datasets
  • Diversos conjuntos de dados sobre saúde disponíveis no Kaggle.
  1. CDC Data & Statistics
  • Dados de saúde pública dos EUA fornecidos pelo CDC.
  1. WHO Open Data
  • Dados de saúde global da Organização Mundial da Saúde.

Dados Ambientais

  1. NASA Earth Data
  • Dados ambientais e climáticos da NASA.
  1. NOAA Climate Data Online
  • Dados climáticos e meteorológicos dos EUA.
  1. European Environment Agency
  • Dados ambientais da Agência Europeia do Ambiente.

Dados de Redes Sociais

  1. Twitter API
  • Acesso a dados de tweets em tempo real e históricos.
  1. Facebook Graph API
  • Acesso a dados do Facebook.
  1. Reddit API
  • Acesso a dados de postagens e comentários do Reddit.

Dados Educacionais

  1. UCI Machine Learning Repository
  • Conjuntos de dados para aprendizado de máquina e pesquisa.
  1. Kaggle: Education Datasets
  • Conjuntos de dados educacionais disponíveis no Kaggle.
  1. National Center for Education Statistics
  • Dados sobre educação nos EUA.

Dados de Transporte

  1. OpenStreetMap
  • Dados de mapas e rotas abertos.
  1. UK Department for Transport Data
  • Dados de transporte do Reino Unido.
  1. NYC Open Data: Transportation
  • Dados de transporte da cidade de Nova York.

Dados de Imagens e Áudio

  1. ImageNet
  • Um grande banco de dados de imagens anotadas.
  1. LibriSpeech
  • Conjunto de dados de áudio de fala em inglês.
  1. Flickr8k
  • Conjunto de dados de imagens e legendas.

Outros Dados

  1. Awesome Public Datasets on GitHub
  • Uma lista curada de conjuntos de dados públicos no GitHub.
  1. Google Dataset Search
  • Ferramenta de busca de conjuntos de dados do Google.
  1. DataHub
  • Plataforma para encontrar e compartilhar conjuntos de dados.

Esperamos que esta lista ajude você a encontrar os dados necessários para seus próximos projetos de engenharia e ciência de dados. Se você conhece outras fontes de dados valiosas, compartilhe nos comentários abaixo!

Conclusão

A diversidade de fontes de dados disponíveis hoje é incrível. Não importa qual seja o seu campo de estudo ou interesse, há uma grande probabilidade de que você encontre um conjunto de dados que atenda às suas necessidades. Explore essas fontes, experimente diferentes conjuntos de dados e continue aprimorando suas habilidades em engenharia e ciência de dados.

Leave a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *

Scroll to Top