O que é viés e imparcialidade no aprendizado de máquina?
O que significa um modelo de IA ser “tendencioso”? Enquantojustiça é um conceito socialmente definido, viés algorítmico é matematicamente definido. Uma família de métricas de viés e imparcialidade na modelagem descreve as maneiras pelas quais um modelo pode funcionar de maneira diferente para grupos distintos em seus dados.
A quantidade de viés em um modelo ou algoritmo pode ser medidaobservando o impacto díspar dos resultados do modelo em diferentes subconjuntos populacionais. O mesmo processo para medir o impacto díspar é freqüentemente usado em estudos de saúde pública.
viés de automação | viés de confirmação |
---|---|
viés de cobertura | viés do experimentador |
viés de grupo | viés de atribuição de grupo |
viés implícito | viés de não resposta |
viés de homogeneidade fora do grupo | viés de reportagem |
Viés e variação são dois componentes principais que você deve considerar ao desenvolver qualquer modelo de aprendizado de máquina bom e preciso.O viés cria erros consistentes no modelo de ML, que representa um modelo de ML mais simples que não é adequado para um requisito específico.
A IA pode ajudar a empresa a analisar suas postagens de emprego anteriores para linguagem tendenciosa de gênero, o que pode ter desencorajado alguns candidatos. Postagens futuras podem ser mais neutras em termos de gênero, aumentando o número de candidatas que passam nas triagens iniciais.A IA também pode ajudar as pessoas a tomar decisões menos tendenciosas.
Por exemplo,um sistema de reconhecimento facial pode começar a ser racialmente discriminatório, ou um sistema de avaliação de solicitação de crédito pode se tornar tendencioso por gênero. Pode haver implicações graves para esses aplicativos tendenciosos. Um viés também pode tornar um aplicativo inútil se usado em um contexto diferente.
Para verificar se seu modelo de aprendizado de máquina é tendencioso ou não, você precisaráfaça muitas perguntas e teste diferentes cenários dentro de seus dados. Por exemplo, você precisará testar se o desempenho do modelo muda se um ponto de dados for alterado ou talvez uma amostra diferente de dados seja usada para treinar ou testar o modelo.
Primeiro, você precisarádeterminar se há algum outlier nos dados, isso teria um impacto não natural no próprio modelo. O tratamento de variáveis ausentes também pode ser um indicador-chave na introdução de viés.
Amostragem aleatória na seleção de dadospode ser uma boa opção se você precisar atenuar esses vieses de ML. A amostragem aleatória simples é um dos métodos mais bem-sucedidos que os pesquisadores usam para minimizar o viés de amostragem. Ele garante que todos na população tenham a mesma chance de serem selecionados para o conjunto de dados de treinamento.
O viés alto de um modelo de aprendizado de máquina é uma condição em que a saída do modelo de aprendizado de máquina está bem distante da saída real. Isso é devido aoa simplicidade do modelo.
O que é justiça e viés na IA?
De muitas maneiras, preconceito e justiça na IA sãoDois lados da mesma moeda. Embora não haja uma definição universalmente aceita para justiça, podemos definir amplamente justiça como a ausência de preconceito ou preferência por um indivíduo ou grupo com base em suas características.
Conjuntos de dados tendenciosos não representam com precisão o caso de uso do modelo de ML, o que leva a resultados distorcidos, preconceito sistemático e baixa precisão. Muitas vezes, o resultado errado discrimina um grupo ou grupos de pessoas específicos. Por exemplo,viés de dados reflete preconceito contra idade, raça, cultura ou orientação sexual.

O viés é e deve ser considerado um grande problema no aprendizado de máquina, poisprejudica as decisões ou previsões que as máquinas fazem. Com isso, corremos o risco de confiar nos resultados imprecisos do modelo, o que pode prejudicar seriamente os negócios ou até mesmo a vida de alguém.
O viés da IA ocorre porque os seres humanos escolhem os dados que os algoritmos usam e também decidem como os resultados desses algoritmos serão aplicados.Sem testes extensivos e equipes diversificadas, é fácil para vieses inconscientes entrarem nos modelos de aprendizado de máquina.
Dependendo de como os sistemas de aprendizado de máquina são usados, tais vieses podem resultar emexperiências ruins de atendimento ao cliente, vendas e receita reduzidas, ações injustas ou possivelmente ilegais e condições potencialmente perigosas.
Avalie as entradas e saídas de cada algoritmo e se elas são suscetíveis ou demonstram viés. Preste muita atenção se os proxies usados por um algoritmo podem introduzir viés.Articular o alvo ideal do algoritmo vs. seu alvo real.
O simples fato de estar ciente do viés inconsciente pode começar imediatamente a reduzir nossa dependência de generalizações ou estereótipos. Estabeleça critérios claros antes de tomar decisões (contratação, promoção, etc.) para que o viés seja eliminado do processo de tomada de decisão. Responsabilize os tomadores de decisão, incluindo você mesmo.
Por exemplo,um algoritmo de reconhecimento facial pode ser treinado para reconhecer uma pessoa branca mais facilmente do que uma pessoa negraporque esse tipo de dado tem sido usado em treinamento com mais frequência. Isso pode afetar negativamente as pessoas de grupos minoritários, pois a discriminação impede a igualdade de oportunidades e perpetua a opressão.
- Viés de Similaridade. Viés de similaridade significa que muitas vezes preferimos coisas que são como nós a coisas que são diferentes de nós. ...
- Viés de conveniência. ...
- Viés de Experiência. ...
- Viés de distância. ...
- Viés de segurança.
Exemplos de algoritmos de aprendizado de máquina de alta tendência incluem:Regressão Linear, Análise Discriminante Linear e Regressão Logística.
Como você avalia a precisão de um modelo de ML?
Para fazer isso, vocêuse o modelo para prever a resposta no conjunto de dados de avaliação (dados retidos) e, em seguida, compare o alvo previsto com a resposta real (verdade básica). Várias métricas são usadas em ML para medir a precisão preditiva de um modelo. A escolha da métrica de precisão depende da tarefa de ML.
Alguns exemplos de algoritmos de aprendizado de máquina com viés baixo sãoÁrvores de decisão, k-vizinhos mais próximos e máquinas de vetores de suporte. Ao mesmo tempo, um algoritmo com alto viés é Regressão Linear, Análise Discriminante Linear e Regressão Logística.
- Fortemente opinativo ou unilateral.
- Baseia-se em reivindicações sem suporte ou sem fundamento.
- Apresenta fatos altamente selecionados que levam a um determinado resultado.
- Pretende apresentar fatos, mas oferece apenas opinião.
- Usa linguagem extrema ou inadequada.
- Crie um plano de pesquisa completo. ...
- Avalie sua hipótese. ...
- Faça perguntas gerais antes de especificar. ...
- Coloque os tópicos em categorias separadas. ...
- Resuma as respostas usando o contexto original. ...
- Mostre os resultados aos respondentes. ...
- Compartilhe tarefas analíticas com a equipe.
Um teste pode ser identificado como tendenciosoquando as pontuações de um grupo são previsivelmente diferentes em comparação com outro grupo de examinandos. Isso pode ser evitado pela compreensão do viés de teste, que inclui viés cultural, viés de conteúdo, viés de método e viés de item.
Definindo o viés de dados e a lista de tipos comuns de viés de dados em ML: viés de seleção, overfitting/underfitting, outliers, viés de medição, viés de recordação, viés do observador, viés de exclusão, viés racial e viés de associação.
A maneira correta de lidar com a alta variância serátreine os dados usando vários modelos. Os métodos de aprendizado de conjunto também ajudam a alavancar alunos fracos e fortes no modelo para melhorar a previsão do modelo. A maioria das soluções mais adequadas em Machine Learning faz uso do Ensemble Learning.
- Mude o modelo: Uma das primeiras etapas para reduzir o viés é simplesmente mudar o modelo. ...
- Certifique-se de que os dados sejam realmente representativos: certifique-se de que os dados de treinamento sejam diversos e representem todos os grupos ou resultados possíveis. ...
- Ajuste de parâmetros: Isso requer uma compreensão do modelo e dos parâmetros do modelo.
Um modelo de alta tendêncianormalmente inclui mais suposições sobre a função de destino ou resultado final. Um modelo de viés baixo incorpora menos suposições sobre a função de destino. Um algoritmo linear geralmente tem um viés alto, o que os faz aprender rápido.
Existem dois tipos de viés na IA. Um éviés de IA algorítmica ou “viés de dados”, onde os algoritmos são treinados usando dados tendenciosos. O outro tipo de viés na IA é o viés da IA social. É aí que nossas suposições e normas como sociedade nos levam a ter pontos cegos ou certas expectativas em nosso pensamento.
Que porcentagem da IA é tendenciosa?
Pesquisadores da USC encontram viés em até38,6%de 'fatos' usados pela IA.
Indiscutivelmente, o exemplo mais notável de viés de IA é oAlgoritmo COMPAS (Correctional Offender Management Profiling for Alternative Sanctions) usado nos sistemas judiciais dos EUA para prever a probabilidade de um réu se tornar reincidente.
- Razão nº 1: Dados de treinamento insuficientes. ...
- Razão nº 2: os humanos são tendenciosos – e, portanto, os dados nos quais a IA é treinada também. ...
- Razão nº 3: A despolarização de dados é excepcionalmente difícil de fazer. ...
- Razão nº 4: a diversidade entre os profissionais de IA não é tão alta quanto deveria ser.
Viés estatístico é um termo usado para descrever estatísticas que não fornecem uma representação precisa da população. Alguns dados são falhos porquea amostra de pessoas pesquisadas não representa com precisão a população.
Viésdistorce a verdade. Está envolvido com a nossa humanidade, um bug no sistema que nem sempre reconhecemos. O viés pode ser tão direto quanto uma preferência inconsciente e pode ser simples ou sinistro. Mas, independentemente de como se manifestem, os preconceitos que abrigamos interferem em nossa capacidade de entender o ambiente real ao nosso redor.
Viés é uma preferência ou preconceito contra um determinado grupo, indivíduo ou característicae vem em muitas formas. A explicabilidade é a capacidade de explicar como ou por que um modelo faz previsões. A justiça é a prática subjetiva de usar IA sem favoritismo ou discriminação, particularmente no que diz respeito aos seres humanos.
O viés de aprendizado de máquina, às vezes também chamado de viés de algoritmo ou viés de IA, éum fenômeno que ocorre quando um algoritmo produz resultados que são sistematicamente prejudicados devido a suposições errôneas no processo de aprendizado de máquina.
De muitas maneiras, preconceito e justiça na IA são dois lados da mesma moeda. Embora não haja uma definição universalmente aceita para justiça, podemos definir amplamente justiça comoa ausência de preconceito ou preferência por um indivíduo ou grupo com base em suas características.
O que são vieses no aprendizado de máquina e na inteligência artificial? O viés nos dados éum erro que ocorre quando certos elementos de um conjunto de dados são sobrecarregados ou super-representados. Conjuntos de dados tendenciosos não representam com precisão o caso de uso do modelo de ML, o que leva a resultados distorcidos, preconceito sistemático e baixa precisão.
O viés é um componente da justiça— se um teste for estatisticamente tendencioso, não é possível que o processo de teste seja justo. No entanto, um processo de teste ainda pode ser injusto, mesmo que não haja viés estatístico presente.
Quais são as 7 formas de viés?
- Sete Formas de Viés.
- Invisibilidade:
- Estereotipagem:
- Desequilíbrio e Seletividade:
- Irrealidade:
- Fragmentação e Isolamento:
- Viés linguístico:
- Viés Cosmético:
Vieses são crenças que não são fundamentadas por fatos conhecidos sobre alguém ou sobre um determinado grupo de indivíduos. Por exemplo, um viés comum é queas mulheres são fracas(apesar de muitos serem muito fortes). Outra é que os negros são desonestos (quando a maioria não é).
Existem várias etapas que podem ser tomadas para mitigar o viés nos modelos de aprendizado de máquina, comousando um conjunto de dados de treinamento diversificado e representativo, removendo variáveis sensíveis, usando técnicas de mitigação de viés, avaliando regularmente o modelo e usando supervisão humana.
O viés de dados em inteligência artificial (IA) e aprendizado de máquina (ML) é um erro que ocorre quando pontos de dados específicos em um conjunto de dados estão sobre ou sub-representados.Como os dados de entrada são distorcidos, você obtém erros na saída. Os modelos de aprendizado de máquina treinados em dados tendenciosos representam de forma imprecisa os casos de uso desejados.
Justiça no aprendizado de máquina refere-se aas várias tentativas de correção de viés algorítmico em processos de decisão automatizados baseados em modelos de aprendizado de máquina. Decisões tomadas por computadores após um processo de aprendizado de máquina podem ser consideradas injustas se forem baseadas em variáveis consideradas sensíveis.
Há uma necessidade crescente de garantir que essa ciência de dados, incluindo as ferramentas e sistemas que usamos, seja ética e justa.Quando o aprendizado de máquina não é justo, o resultado pode ser prejudicial para os usuários e para a comunidade.
Parte 1: As três formas de justiça
Podemos entender melhor como a justiça é percebida subdividindo-a em três categorias:justiça processual, interacional e distributiva.
References
- https://towardsdatascience.com/understanding-bias-and-fairness-in-ai-systems-6f7fbfe267f3
- https://www.snexplores.org/article/think-youre-not-biased-think-again
- https://labelyourdata.com/articles/bias-in-machine-learning
- https://www.sap.com/insights/viewpoints/how-ai-can-end-bias.html
- https://insidebigdata.com/2022/02/09/7-reasons-for-bias-in-ai-and-what-to-do-about-it/
- https://viterbischool.usc.edu/news/2022/05/thats-just-common-sense-usc-researchers-find-bias-in-up-to-38-6-of-facts-used-by-ai/
- https://www.datarobot.com/trusted-ai-101/ethics/bias-and-fairness/
- https://datatron.com/real-life-examples-of-discriminating-artificial-intelligence/
- https://magazine.amstat.org/blog/2023/02/01/measuring-and-reducing-bias/
- https://www.aha.org/aha-center-health-innovation-market-scan/2021-10-05-4-steps-mitigate-algorithmic-bias
- https://www.infoprolearning.com/blog/10-ways-you-can-reduce-bias-in-the-workplace/
- https://medium.com/swlh/the-bias-variance-tradeoff-f24253c0ab45
- https://en.wikipedia.org/wiki/Fairness_(machine_learning)
- https://www.bmc.com/blogs/bias-variance-machine-learning/
- https://study.com/learn/lesson/test-bias-types-examples-cultural.html
- https://canvas.cwu.edu/files/1925770/download?download_frd=1&verifier=QRNH2eiZrCe7VQxJf2Ek6xUjdlB5JZkhonePXdMj
- https://libguides.uwgb.edu/bias
- https://levity.ai/blog/ai-bias-how-to-avoid
- https://www.gfoa.org/fairness
- https://mailchimp.com/resources/data-bias-causes-effects/
- https://www.baeldung.com/cs/machine-learning-biases
- https://www.seldon.io/bias-vs-fairness-vs-explainability-in-ai
- https://www.forbes.com/sites/bernardmarr/2022/09/30/the-problem-with-biased-ais-and-how-to-make-ai-better/
- https://www.javatpoint.com/bias-and-variance-in-machine-learning
- https://www.twine.net/blog/bias-in-data-collection/
- https://www.predictiveindex.com/learn/support/introduction-to-fairness-bias-and-adverse-impact/
- https://www.mastersindatascience.org/learning/difference-between-bias-and-variance/
- https://www.techtarget.com/searchenterpriseai/definition/machine-learning-bias-algorithm-bias-or-AI-bias
- https://www.statice.ai/post/data-bias-impact
- https://analyticsindiamag.com/how-to-address-bias-variance-tradeoff-in-machine-learning/
- https://developers.google.com/machine-learning/crash-course/fairness/types-of-bias
- https://deepchecks.com/reducing-bias-and-ensuring-fairness-in-machine-learning/
- https://www.coursera.org/articles/machine-learning-fairness
- https://towardsdatascience.com/5-tools-to-detect-and-eliminate-bias-in-your-machine-learning-models-fb6c7b28b4f1
- https://www.statice.ai/post/data-bias-types
- https://glginsights.com/articles/the-problem-of-bias/
- https://www.taus.net/resources/blog/9-types-of-data-bias-in-machine-learning
- https://www.spiceworks.com/tech/artificial-intelligence/guest-article/how-to-reduce-bias-in-machine-learning/
- https://lifepointhealth.net/news/5-biases-that-impact-decision-making
- https://towardsdatascience.com/contents-9b2e49f49fe9
- https://machinelearningmastery.com/gentle-introduction-to-the-bias-variance-trade-off-in-machine-learning/
- https://www.lexalytics.com/blog/bias-in-ai-machine-learning/
- https://www.indeed.com/career-advice/career-development/how-to-avoid-researcher-bias
- https://docs.aws.amazon.com/machine-learning/latest/dg/evaluating-model-accuracy.html