Superando o viés: modelando o rótulo "desconhecido"
cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br


Recentemente, pesquisei alguns relatórios específicos de encontros de OVNIs e devo admitir que eles podem parecer bastante convincentes. Mas então me lembro do enorme efeito de seleção. Todos nós passamos a vida vendo coisas, e apenas raramente alguns de nós relatam oficialmente algo tão estranho que as autoridades devam saber. E então, quando especialistas analisam esses relatórios, geralmente os atribuem a uma das poucas categorias mundiais de explicações, como “Vênus” ou “helicóptero”. Por apenas uma pequena fração, eles o rotulam de “não identificado”. E de milhares desses casos, os poucos mais estranhos e convincentes se tornam os mais amplamente relatados. Então é claro que os relatórios de OVNIs que vejo são convincentes!

No entanto, isso não significa que esses relatórios não estejam nos falando sobre novos tipos de coisas. Afinal, perceber desvios estranhos das categorias existentes é como sempre aprendemos sobre novos tipos de coisas. Portanto, devemos estudar esses dados cuidadosamente para ver se a variação aleatória em torno de nossas categorias existentes parece suficiente para explicá-lo ou se precisamos expandir nossa lista de categorias e as teorias em que elas se baseiam. Infelizmente, embora tenha sido gasto muito tempo e esforço coletando todos esses relatórios, parece que longe menos esforço foi gasto para analisá-los formalmente. Então é isso que eu proponho.

Especificamente, sugiro que modelemos mais formalmente a opção de rotular algo de “desconhecido”. Ou seja, modele todos esses dados como uma mistura finita de classes e, em seguida, modele explicitamente o processo pelo qual os itens são atribuídos a uma classe conhecida, em vez de rotulados como “desconhecidos”. Deixe-me explicar.

Imagine que tínhamos um conjunto de dados de imagens de caracteres do alfabeto, de A a Z, e talvez mais alguns caracteres estranhos como წ. Belas imagens limpas. Em seguida, adicionamos muito ruído e os bagunçamos de várias maneiras e em graus variados. Em seguida, mostramos às pessoas essas imagens e pedimos que as rotulem como caracteres de A a Z ou como “desconhecidas”. Eu posso ver três processos principais que levariam as pessoas a escolher esse rótulo “desconhecido” para um caso:

  1. A imagem é estranha, muito distante do protótipo (= centro) de qualquer caractere A a Z.
  2. A imagem fica no meio do caminho entre protótipos de dois ou mais caracteres específicos de A a Z.
  3. A imagem corresponde ao protótipo de um dos caracteres estranhos que adicionamos, não em A a Z
READ  6 curtas de terror assustadores para entrar no espírito do Halloween

Superando o viés: modelando o rótulo "desconhecido" 1

Se modelarmos formalmente esse processo, poderemos pegar o suficiente desses dados de rotulagem e descobrir se, de fato, caracteres estranhos foram adicionados ao conjunto de dados de imagens e descrever aproximadamente seus recursos.

Você deseja testar esse processo e ver como ele pode identificar os personagens estranhos e seus recursos. Mas uma vez que funcione para imagens de personagens, ou algum outro problema simples, poderíamos tentar fazer o mesmo nos relatórios de OVNIs. Modele os casos “desconhecidos” nesses dados como uma combinação de casos estranhos, intermediários e casos que se agrupam em torno de novos protótipos, que poderíamos descrever mais ou menos. Poderíamos então comparar as descrições grosseiras dessas novas classes com explicações ufológicas populares, mas radicais, como alienígenas ou projetos militares secretos.

cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br

Mais formalmente, suponha que temos um espaço de modelos de classe, parametrizado por UMA, modelos que predizem a probabilidade P (X|UMA) que um caso de dados X surgiria dessa classe. Então, dado um conjunto de classes C, cada um com parâmetros UMAc e um peso de classe Wc, nós poderíamos para qualquer caso X produzir um vetor de probabilidades pc = Wc* P (X|UMAc), um para cada classe c no C. Uma pessoa pode tender mais a atribuir o rótulo conhecido eu quando o valor de peu foi alto, em relação ao outro pc. E se um subconjunto você de aulas C eram desconhecidos, as pessoas tendem a atribuir o rótulo “desconhecido” quando:

  1. até o mais alto pc foi relativamente baixo,
  2. os dois primeiros pc tinha valores quase iguais, ou
  3. o mais alto pc pertencia a uma classe desconhecida, com c no você.

Usando este modelo de como o rótulo “desconhecido” é escolhido, em seguida, é fornecido um conjunto de dados de casos rotulados X, incluindo o rótulo desconhecido, podemos encontrar os melhores parâmetros Wc e UMAc para ajustar esse conjunto de dados. Nesse processo de ajuste, pode-se adicionar novas classes desconhecidas, não incluídas no conjunto inicial de etiquetas eu. E, dessa maneira, descubra se esse conjunto de dados suporta a ideia de novas classes desconhecidas vocêe com quais parâmetros.

READ  As melhores ofertas para comprar agora

Para relatórios de OVNIs, a primeira pergunta é se os dois primeiros processos para produzir rótulos “desconhecidos” parecem suficientes para explicar os dados ou se precisamos adicionar novas classes. E se precisarmos de novas classes, eu estaria interessado em ver se há uma classe adequada à teoria do “protótipo militar”, onde os eventos acontecem mais perto de bases militares, mais nos dias e horários em que essas pessoas tendem a trabalhar, com mais resposta inteligente, velocidades e acelerações extremas impressionantes, mas não loucas, mais ruído e menos falhas no equipamento próximo. E eu ficaria especialmente interessado em ver se há uma classe que se encaixe na teoria “alienígena”, com velocidades e acelerações extremas mais loucas, tamanhos enormes, mau funcionamento próximo, silêncio total, aparente conhecimento notável etc.

9a adicionado: É claro que a qualidade dessa análise estatística dependerá muito da qualidade da representação dos dados X. Representações ruins de caracteres de baixo nível ou de relatórios de OVNIs não são susceptíveis de revelar muita coisa interessante ou profunda. Portanto, vale a pena dedicar muito esforço ao processamento de relatórios de OVNIs para criar boas representações de alto nível de seus recursos.

Classificação por estrelas GD
Carregando…

cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *