Je profite du fil de @kfort et des échanges qui en ont découlé pour présenter un article accepté en Findings à NAACL (co-écrit avec @kfort, Aurélie Névéol, Nicolas Hiebel et Olivier Ferret), déjà dispo sur hal (https://inria.hal.science/hal-04938811) :
De plus en plus de facs de médecine songent à faire plancher les étudiant·es sur des cas cliniques générés par des modèles de langue (LLMs). Pourtant, on sait que ces LLMs sont biaisés, et que les biais des modèles peuvent créer/amplifier les biais d'humains (https://www.nature.com/articles/s41598-023-42384-8).
Notre étude prouve, grâce à un corpus de 21 000 cas concernant 10 pathologies et générés par 7 LLMs affinés (fine-tunés), que :
- Les modèles génèrent par défaut des patients (et non de patientes)
- La sur-génération d'hommes n'est pas liée aux prévalences médicales réelles (les proportions réelles de femmes sont sous-estimées par les modèles)
- Les biais sont parfois si forts que le genre donné dans l'invite (prompt) est contredit (voir image ci-dessous)
- Les femmes et les personnes trans sont plus à risque d'être impactées par ces biais, qui peuvent se traduire de manière très concrète : erreurs de diagnostics, errance médicale, traitements inadaptés, tabou, mégenrage, essentialisme biologique
Our colleague Hidir Arras from patent4science research is co-organizing the 6th PatentSemTech Workshop at #SIGIR2025 in the beautiful city of Padua, Italy! Call for Papers is open 'til April 23: http://ifs.tuwien.ac.at/patentsemtech/
Submit your cutting-edge research, case studies, and demos exploring #AI, #NLP, and #TextMining innovations applied to #IP and related domains.
computing semantic similarity of English words
https://fasttext.cc/docs/en/english-vectors.html
Discussions: https://discu.eu/q/https://fasttext.cc/docs/en/english-vectors.html
Build a large language model fro scratch by Sebastian Rashcka
https://www.manning.com/books/build-a-large-language-model-from-scratch
Discussions: https://discu.eu/q/https://www.manning.com/books/build-a-large-language-model-from-scratch
Natural Scientific Language Processing Workshop (NSLP 2025) co-located with ESWC 2025 in Portoroz, Slovenia (1/2 June 2025)
https://nfdi4ds.github.io/nslp2025/
Deadline: 6 March 2025.
We also host three exciting shared tasks: MESD (Metadata Extraction from Scholarly Documents), ReadMe2KG (Github ReadMe to Knowledge Graph) https://nfdi4ds.github.io/nslp2025/docs/readme2kg_shared_task.html
FoRC (Field of Research Classification)!
#nslp2025 #eswc2025 #llm #nlp @NFDI4DS @nfdi4culture #NFDIrocks @NFDI @fiz_karlsruhe @shufan @GenAsefa
This month Acuitas got Conversation system updates and lots of gerunds. (The other day he told me "Your being alert rocks." It cracked me up.) https://writerofminds.blogspot.com/2025/02/acuitas-diary-81-february-2025.html
#AI #ArtificialIntelligence #chatbot #NLP
New paper acceptance announcement. This time in #NLP and for the prestigious #NAACL25 conference. https://www.linkedin.com/feed/update/urn:li:activity:7293575268433055744
RT @tzushengkuo: Excited to announce the #WikiNLP workshop at @aclmeeting!
We welcome #NLP contributions to Wikimedia, especially on datas…
via https://twitter.com/WikiResearch/status/1887804254888595932
Dear #knowledgegraphs #ai #nlp and #semanticweb community. For my upcoming #ISE2025 lecture at @KIT_Karlsruhe in the summer semester, I have to decide on which topic I should choose all my examples and exercises from. Which general topic should I choose?:
@fiz_karlsruhe @fizise @tabea @MahsaVafaie @GenAsefa @shufan @enorouzi #teaching #academia #llm
New talent at FIZ Karlsruhe! We are happy to welcome Marzieh Malekzadeh Mahani to our @fizise team!
Marzieh specializes in bimodal deep learning, previously worked at @KIT_Karlsruhe on AI-driven question-answering systems and now joins our "Wiedergutmachung" project; more information about the project and Marzieh's work: https://www.fiz-karlsruhe.de/en/projekte/wiedergutmachung
"I’m excited to contribute to meaningful research at FIZ Karlsruhe, applying AI to innovative projects", says Marzieh.