#big data


S'abonner
| | interview

Marinka Zitnik: «L’IA permet d’aborder des problèmes insolubles, comme les interactions médicamenteuses»

Marinka Zitnik à son bureau de Stanford en 2018. | Stanford / L.A. Cicero

Heidi.news est partenaire des Applied Machine Learning Days (AMLD), et déplace jusqu'au mercredi 29 janvier sa rédaction à l'EPF de Lausanne, sur le site de l'événement.

Marinka Zitnik fait partie de ces jeunes talents du milieu académique dans le champ de l’IA appliquée à la santé. En poste à Harvard depuis peu, après un post-doctorat remarqué à Stanford, la chercheuse s’intéresse aux moyens de faire parler les données pour faciliter la découverte de nouveaux médicaments.

À l’occasion des AMLD 2020, nous l’avons rencontrée pour évoquer notamment un sujet dans le vent: la réorientation de médicaments, qui consiste à identifier de nouvelles indications thérapeutiques pour des molécules déjà sur le marché. Entretien.

| | interview

Pourquoi il faut se méfier des prédictions de l’IA en biomédecine

Pixabay / Nvodicka

Heidi.news est partenaire des Applied Machine Learning Days 2020, qui se tiennent en ce moment à l’EPFL. En déplaçant notre rédaction sur le site de l'événement, nous vous en proposons une couverture approfondie.

Gavin Brown est professeur de machine learning à l’université de Manchester. Invité aux AMLD 2020 à propos de la thématique de l’IA et de la santé, ce spécialiste a évoqué la fiabilité limitée des modèles prédictifs et la nécessité pour les experts d’y prendre garde. Une intervention en forme d’avertissement quant aux promesses du machine learning. Entretien.

Heidi.news – Qu’est-ce que la reproductibilité et en quoi est-ce important?
| | news

Quand l’IA permet de sauver des enfants

Terre des hommes, DR

Heidi.news est partenaire des Applied Machine Learning Days (AMLD). En déplaçant notre rédaction sur le site de l'événement, nous vous en proposons une couverture approfondie.

À l’occasion des Applied Machine Learning Days de l’EPFL, deux jeunes chercheuses de l’Institut de santé globale de l’Unige sont venues présenter leurs travaux en vue améliorer le système de santé du Burkina Faso. Dans le cadre d’un projet de la fondation Terre des hommes, elles s’attachent à employer le machine learning pour lutter contre la mortalité infantile et calibrer la réponse sanitaire aux épidémies, dans un des pays les plus pauvres du monde.

Pourquoi c’est intéressant. Loin des projets les plus médiatisés, comme ceux visant à produire des essais cliniques virtuels ou des IA d’aide au diagnostic en cancérologie, ces travaux plus modestes ont des répercussions concrètes et à court terme sur le terrain.

| | radar

23andMe se lance dans la pharma grâce aux génomes de ses clients

Pixabay / Pete Linforth

23andMe, qui commercialise des tests génétiques pour le grand public, vient d’annoncer un partenariat avec un laboratoire pharmaceutique spécialisé en dermatologie, l’espagnol Almirall. L’accord, évoqué par Bloomberg, porte sur le développement clinique d’un nouveau traitement contre le psoriasis et d’autres maladies auto-immunes, conçu grâce aux données de ses utilisateurs. Les détails financiers ne sont pas encore connus, mais c’est la première fois que le fleuron américain des tests génétiques dépose un brevet pour un médicament candidat.

Pourquoi on vous en parle. Et le monde découvre que 23andMe ne se borne pas à proposer des tests amusants pour évaluer son taux d’ascendance viking... Avec près de dix millions d’utilisateurs, la société californienne – créée par Anne Wojcicki, ex-compagne de Sergey Brin – a récolté une manne astronomique de données génétiques. Le potentiel du big data médical est immense: identifier des pathologies, développer de nouveaux médicaments et, à l’avenir, des traitements personnalisés… Dès 2013, le journaliste Charles Seif invitait, dans The Scientific American, à ne pas être dupe des objectifs de long terme du futur Google de la génomique.

link

À lire sur Bloomberg (EN)

| | radar

Novartis parie sur une nouvelle molécule contre les problèmes cardiovasculaires

Usine de Novartis à Stein, en Argovie. | Georgios Kefalas / Keystone

Dimanche 24 novembre, Novartis a annoncé avoir acheté The Medecine Company pour 9,7 milliards de dollars. Le site StatNews se penche sur le contexte et les enjeux de cette acquisition. «Nous espérons réimaginer le traitement de la première cause mondiale de décès (les maladies cardiovasculaires, ndlr.)», a déclaré sur Twitter Vas Narasimhan, CEO de Novartis. Le médicament anti-cholestérol au coeur de la transaction, nommé Inclisiran, devrait être administré deux fois par an (contre toutes les deux semaines ou chaque mois pour les autres).

Pourquoi on vous en parle. Derrière cette acquisition se dessine l’espoir pour le groupe pharmaceutique suisse de réaliser un vieux rêve: la mise sur le marché du «blockbuster» contre les maladies cardiovasculaires. Novartis n’est pas le premier sur ce secteur: les firmes américaines Amgen et Regeneron ont toutes deux commercialisé des traitements basés sur le même mécanisme. Mais leurs ventes n’ont pas eu le succès espéré.

link

Lire l'article sur Statnews(EN)

| | radar

Les grands sites de santé vendent leurs données aux publicitaires

WebMD fait partie de la centaine de sites web qui revendent les données collectées par des patients en quête d'informations. | WebMD, DR

Certains des sites web de santé les plus populaires du Royaume-Uni partagent les données qu’ils recueillent, rapporte le Financial Times. Les données – symptômes, diagnostics, noms de médicaments, périodes de menstruation et de fertilité, etc., souvent en lien avec des identifiants personnels – sont partagées avec les géants du ciblage publicitaire comme Google, Amazon et Facebook, ou des courtiers en données moins connus.

Pourquoi c’est inquiétant. En enquêtant sur une centaine de sites web de santé, dont WebMD, Healthline, Babycentre et Bupa, le Financial Times s’est rendu compte que des «cookies» de traçage sont introduits sans recueil du consentement des visiteurs. C’est pourtant une exigence légale au Royaume-Uni, qui applique le règlement européen en matière de protection des données personnelles. Ces pratiques pourraient donc très bien avoir cours dans d’autres pays.

link

A lire dans le Financial Times (EN)

| | radar

Le plan secret de Google pour indexer les données de santé des Américains

Pixabay / Jonny Lindner

Il répond au doux nom de projet Nightingale («rossignol»). Le Wall Street Journal a révélé lundi 11 novembre une initiative de Google pour indexer les données de santé de millions d’Américains. La plateforme agrège des fiches d’hospitalisation, des résultats de biologie et des diagnostics médicaux. Le projet, lancé en secret en 2018, est mené en collaboration avec Ascension, un vaste réseau de soins catholique qui gère 150 hôpitaux et plus de 50 maisons de retraites américaines.

Pourquoi on vous en parle. Google et Ascension déclarent utiliser ces données pour améliorer la qualité des soins. Or la loi fédérale américaine permet à un établissement de santé de partager les dossiers de ses patients sans leur consentement explicite, dès lors que les informations sont employées dans une optique de soins. Reste le problème éthique – et politique. D’après le WSJ, la firme de Mountain View serait dans le viseur du puissant département de la justice américain, qui envisage de lancer une enquête pour abus de position dominante. Une véritable épée de Damoclès.

link

À lire dans le Wall Street Journal

| | radar

Le CEO de Twitter va interdire la publicité politique, contrairement à Facebook

Jack Dorsey est le co-fondateur et PDG de Twitter | KIM CHUL-SOO/EPA/KEYSTONE

Il y a de la tension dans l’air entre les deux réseaux sociaux Twitter et Facebook. Jack Dorsey, PDG et co-fondateur de Twitter, a annoncé, dans une série de tweets, sa volonté de mettre fin aux campagnes de publicité ciblée s’inscrivant dans un contexte politique. Les nouvelles conditions d’utilisation entreront en vigueur le 22 novembre, a-t-il annoncé. Dans le New York Times, Kara Swisher, journaliste spécialiste de la technologie, cofondatrice du média Recode, et grande critique de Facebook devant l’éternel, y voit une leçon donnée à Mark Zuckerberg.

Pourquoi c’est important. Le PDG de Facebook est indirectement visé par cette série de tweets. Il a été mis sur le grill face au Congrès américain le 23 octobre par la députée américaine Alexandria Ocasio-Cortez qui lui demandait pourquoi son réseau social continuait d’accepter que soient diffusés des mensonges en guise de publicités ciblées politiques. Dans ses tweets, Jack Dorsey écrit notamment: «Ce n’est pas une question de liberté d’expression. Le problème, c’est de pouvoir payer pour artificiellement augmenter la portée de ses messages. Et payer pour accroître la portée des discours politiques a des conséquences profondes, que nos infrastructures politiques actuelles ne sont pas préparées à gérer.»

link

Lire l'article du New York Times

| | radar

Mal employée, l'intelligence artificielle risque d'accentuer les inégalités des systèmes de santé

Image d'illustration | Peyri Herrera/Flickr/Creative Commons

Des ingénieurs aux médecins, nul ne tarit d’éloges sur l’intelligence artificielle et ses multiples promesses: diagnostiquer plus tôt le cancer, s’assurer que les patients reçoivent les traitements les plus pertinents... Le site de Nature en relate un exemple malheureux. Des chercheurs ont ainsi démontré le manque d’équité d’un algorithme chargé de calculer des ‘scores de risque’ médical pour placer des patients à risque dans des programmes de soin spécifique. Les personnes noires étaient moins souvent sélectionnées que les personnes blanches, en raison de biais inhérents dans la conception de l’algorithme!

Pourquoi c’est préoccupant. Les algorithmes de machine learning ont eux aussi des biais. Ils reproduisent soit ceux de leurs créateurs soit ceux des données avec lesquels on les a alimentés. Ils fonctionnent en construisant des corrélations. Si, par exemple, un certain type de profil socio-culturel est sur-représenté dans les données d’apprentissage, alors l’algorithme fonctionnera moins bien pour les autres communautés. A l’heure où l’on entraîne aussi ce type de programmes au diagnostic du cancer à partir de patients d’une autre région du monde, le risque est aussi médical.

link

Lire l'article publié par Nature

| | radar

Pourquoi il faut relativiser les prédictions de la science des données

Image d'illsutration | Marcin Ignac/Creative Commons via Flicrk

Faut-il avaler sans sourciller toutes les prédictions de la science des données, ce nouvel oracle du numérique? Non, selon Andrea Jones-Rooy, professeure de data science à l’Université de New York, dans une tribune publiée par Quartz. Elle rappelle que les données ne sont qu’un énième outil façonné par l’homme, et qu’elles n’existent que parce qu’on a bien voulu les collecter, à l’exclusion de tout le reste. Autrement dit, les données, à elles seules, ne veulent rien dire, en dehors du cadre où il a été prévu de les exploiter.

Pourquoi c’est important. De plus en plus de voix s’élèvent contre les biais des algorithmes, qui résultent de choix parfois inconscients réalisés pendant leur développement. La chercheuse rappelle ainsi les quatre principales typologies d’erreurs pouvant être introduites dans les données: l’erreur aléatoire, l’erreur systématique, l’erreur dans le choix de ce qu’on mesure, et enfin l’erreur d’exclusion, qui provient de populations délibérément ignorées dans le choix des données.

link

Lire l'article sur le site de Quartz (EN)

newsletter_point-du-jour

Recevez_ chaque matin un résumé de l'actualité envoyé d'une ville différente du monde.

| | news

Les données des restaurants sur Internet servent à prédire les facteurs socio-économiques d'un quartier

Les données en ligne des restaurants pourraient permettre d'estimer les facteurs socio-économique d'un quartier d'après une équipe du MIT | Yinan Chen, Pixabay

Les données en ligne des restaurants seraient suffisantes pour déterminer les facteurs socio-économiques du quartier dans lesquels ils se trouvent, d’après une équipe du MIT de Boston, qui a testé cette approche sur des grandes villes chinoises.

Pourquoi c’est intéressant. Les données démographiques et économiques, ainsi que les habitudes de consommation des habitants, sont des informations de plus en plus recherchées dans le cadre du développement urbain, notamment pour les projets de smart city. À Toronto par exemple, le groupe frère de Google, Sidewalk, déploie une myriade de capteurs pour obtenir ces précieuses données. Il y aurait donc plus simple, selon les chercheurs du Massuchusetts Institute of Technology (MIT), qui publient leur étude dans PNAS.

| | radar

A Los Angeles, les ratés de la police qui devait prévoir le crime à partir des big data

Des figurines sur des composants informatiques (image d'illustration) | Creative Commons

Prédire la criminalité future à partir de la criminalité passée, à l’aune des techniques de big data: plusieurs polices s’y sont essayées aux Etats-Unis, notamment à Los Angeles. Les expérimentations sont cependant loin de fournir les résultats escomptés, raconte le magazine californien Government Technology.

Pourquoi c’est délicat. L’idée d’une police prédictive capable de prévoir l’avenir à partir des statistiques passées les plus détaillées possibles semble séduisante de prime abord. Pourtant, elle a un énorme défaut: elle considère qu’un résultat passé va nécessairement se répéter. Ces technologies reproduisent aussi les biais, furent-ils inconscients, de leurs créateurs, ce qui implique de redoubler de prudence dans leur évaluation et leur utilisation.

link

Lire l'article dans Government Technology (EN)