{"id":2159,"date":"2026-07-02T17:50:44","date_gmt":"2026-07-02T17:50:44","guid":{"rendered":"https:\/\/resguardodigital.cl\/?p=2159"},"modified":"2026-07-02T17:50:44","modified_gmt":"2026-07-02T17:50:44","slug":"por-fin-existe-un-sitio-para-reportar-todas-las-fallas-de-la-ia","status":"publish","type":"post","link":"https:\/\/resguardodigital.cl\/?p=2159","title":{"rendered":"Por fin existe un sitio para reportar todas las fallas de la IA"},"content":{"rendered":"<div>\n<p>De vez en cuando, me encuentro con modelos de IA que se comportan de forma incorrecta y extra\u00f1a. Normalmente, no hay nada que se pueda hacer al respecto, salvo compartir mis an\u00e9cdotas con los lectores de WIRED. Pero eso podr\u00eda cambiar pronto.<\/p>\n<p>Un grupo de investigadores de IA ha creado un sitio web colaborativo, <strong>Flaw Reporting for AI (FLARE-AI), para reportar y rastrear los da\u00f1os causados \u200b\u200bpor la IA. Por ejemplo, si un <em>chatbot<\/em> genera <em>malware<\/em> o una receta para fabricar bombas, filtra informaci\u00f3n personal o provoca delirios en los usuarios, FLARE-AI podr\u00eda usarse para alertar.<\/strong> El c\u00f3digo fuente abierto del sistema permite que otros verifiquen un problema y env\u00eden los informes a los creadores del modelo, as\u00ed como a organizaciones como MITRE, una organizaci\u00f3n sin fines de lucro que monitorea los problemas con los sistemas t\u00e9cnicos. Es similar a Downdetector, que recopila informes de usuarios en tiempo real sobre interrupciones de servicio globales que afectan a aplicaciones y sitios web.<\/p>\n<h2>Un sitio para acusar a tu IA maligna<\/h2>\n<p>El sitio web supone un paso m\u00e1s en el trabajo continuo del grupo en materia de notificaci\u00f3n de fallas de IA. Los miembros del grupo tambi\u00e9n prestaron asesoramiento sobre un proyecto de ley del Congreso anunciado en junio, que supondr\u00eda que el gobierno de EE UU asumiera un papel central en el seguimiento de este tipo de comportamientos indebidos de la IA.<\/p>\n<p>\u00abEn la actualidad, no existe una forma centralizada y transparente de informar sobre fallas en los sistemas de IA\u00bb, afirma Avijit Ghosh, investigador de pol\u00edticas de IA en HuggingFace, quien codirigi\u00f3 el desarrollo de FLARE-AI junto con los cient\u00edficos inform\u00e1ticos Elaine Zhu y Shayne Longpre.<\/p>\n<p>El sistema de alarma se desarroll\u00f3 en colaboraci\u00f3n con 49 expertos en IA de 32 organizaciones diferentes. En <a data-offer-url=\"https:\/\/www.ai-reports.org\/paper.pdf\" class=\"external-link\" data-event-click=\"{&quot;element&quot;:&quot;ExternalLink&quot;,&quot;outgoingURL&quot;:&quot;https:\/\/www.ai-reports.org\/paper.pdf&quot;}\" href=\"https:\/\/www.ai-reports.org\/paper.pdf\" rel=\"nofollow noopener\" target=\"_blank\">un documento<\/a> que describe el trabajo, los investigadores argumentan que su iniciativa podr\u00eda resultar crucial a medida que la IA se adopte de forma m\u00e1s generalizada y los sistemas con capacidad ag\u00e9ntica adquieran mayor poder. Consideran que la falta de un m\u00e9todo consistente para informar sobre fallas en la IA es un problema importante.<\/p>\n<p>\u00abMe parece excelente. Apoyo cualquier iniciativa que haga que la IA sea m\u00e1s transparente\u00bb, afirma Jessica Ji, investigadora del centro de estudios Center for Security and Emerging Technology. Ji se\u00f1ala que los investigadores tienen raz\u00f3n al destacar que los mecanismos de denuncia existentes est\u00e1n fragmentados y que los modelos de IA son opacos.<\/p>\n<p>Aunque las fallas y los problemas de ciberseguridad reciben mucha atenci\u00f3n, Ghosh comenta que los problemas con los sistemas de IA abarcan temas como el da\u00f1o psicol\u00f3gico, la discriminaci\u00f3n o los sesgos, y la desinformaci\u00f3n. A\u00f1ade que las distintas empresas tienen est\u00e1ndares diferentes en relaci\u00f3n con estos temas, lo que significa que algunos problemas pasan desapercibidos. \u00abAnte la ausencia de un sistema de divulgaci\u00f3n coordinado, no existen mecanismos externos que garanticen la transparencia\u00bb, afirma Ghosh.<\/p>\n<p>Una serie de incidentes recientes relacionados con herramientas populares de IA demuestra lo f\u00e1cil que es que esta tecnolog\u00eda falle.<\/p>\n<p>Esta semana, una empresa llamada LayerX revel\u00f3 una forma de enga\u00f1ar a los navegadores web con IA, incluidos Atlas de OpenAI y Comet de Perplexity, para que eludieran sus medidas de seguridad. Por ejemplo, convencer al modelo de IA del navegador de que estaba jugando a un juego podr\u00eda provocar que el navegador se descontrolara e intentara hackear un sitio web. Seg\u00fan LayerX, las empresas responsables de los navegadores afectados ya han solucionado el problema. Y en abril, Johann Rehberger, un investigador de seguridad, descubri\u00f3 una forma de enga\u00f1ar a Claude para que revelara datos personales utilizando im\u00e1genes generadas por ChatGTP.<\/p>\n<div class=\"ContentCardEmbedWrapper-hkvhYu kMYDit content-card-embed content-card-embed--stacked\" data-testid=\"ContentCardEmbedWrapper\">\n<div class=\"ContentCardEmbedImage-bqahne fjmzkP content-card-embed__image\" data-testid=\"ContentCardEmbedImage\"><span class=\"SpanWrapper-kFnjvc eKnjjD responsive-asset\"><picture class=\"ResponsiveImagePicture-jKunQM gjCCFj responsive-image\"><\/picture><\/span><\/div>\n<div class=\"ContentCardEmbedInfo-buyHWH gWLOee\">\n<div class=\"BaseText-fEwdHD ContentCardEmbedHed-kDKGDs fUtEc dlHXUJ content-card-embed__hed\" data-testid=\"ContentCardEmbedHed\">Claude destap\u00f3 un fallo que permit\u00eda obtener boletos para los grandes festivales de m\u00fasica de EE UU<\/div>\n<p>Un investigador descubri\u00f3 que, utilizando Claude Opus 4.7 de Anthropic, pod\u00eda acceder sin autorizaci\u00f3n a la p\u00e1gina web de Front Gate, utilizada por todos los festivales, desde Lollapalooza hasta Bonnaroo, y emitir libremente cualquier entrada que quisiera.<\/p>\n<\/div>\n<\/div>\n<h2>Nuevos y extra\u00f1os tipos de problemas<\/h2>\n<p>El a\u00f1o pasado, OpenAI se vio obligada a actualizar sus modelos tras descubrir que eran excesivamente aduladores, lo que a veces parec\u00eda fomentar el pensamiento delirante.<\/p>\n<p>Rumman Chowdhury, CEO y fundadora de Humane Intelligence PBC, afirma que FLARE-AI podr\u00eda ser una herramienta \u00fatil para que muchos desarrolladores de IA implementen sistemas para reportar problemas con sus herramientas. Sin embargo, a\u00f1ade que este tipo de iniciativas suelen presentar serios desaf\u00edos.<\/p>\n<\/div>\n","protected":false},"excerpt":{"rendered":"<p>De vez en cuando, me encuentro con modelos de IA que se comportan de forma incorrecta y extra\u00f1a.<\/p>\n","protected":false},"author":1,"featured_media":2160,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[2,9],"tags":[981,737,972,100,49,131,1269,1268,455],"class_list":["post-2159","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-security","category-world","tag-existe","tag-fallas","tag-fin","tag-las","tag-para","tag-por","tag-reportar","tag-sitio","tag-todas"],"_links":{"self":[{"href":"https:\/\/resguardodigital.cl\/index.php?rest_route=\/wp\/v2\/posts\/2159","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/resguardodigital.cl\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/resguardodigital.cl\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/resguardodigital.cl\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/resguardodigital.cl\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=2159"}],"version-history":[{"count":0,"href":"https:\/\/resguardodigital.cl\/index.php?rest_route=\/wp\/v2\/posts\/2159\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/resguardodigital.cl\/index.php?rest_route=\/wp\/v2\/media\/2160"}],"wp:attachment":[{"href":"https:\/\/resguardodigital.cl\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=2159"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/resguardodigital.cl\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=2159"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/resguardodigital.cl\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=2159"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}