Skip directly to content

La vérité (du texte) et la délicatesse (de l'algo), kézako ? Une piste (encore une) avec Quentin Pleplé

on mar, 07/22/2014 - 12:48

Par Julien Le Bot 

Les robots d'Associated Press se sont donc mis au travail, expliquait ce matin Thomas Oliveau, pour écrire leurs "premiers articles".  Le robot, l'algorithme, le croisement de données, tout ça : le sérail éditorial doit aujourd'hui repenser son travail. Réinventer sa langue. Et se réapproprier son horizon : le contenu, le sens, l'info. Si l'automate bastonne de la brève, quid de l'humain ? Du coup d'oeil ? De l'entretien ? Ceci rejoint toutes ces rencontres et ces initiatives croisées ici ou là par notre équipe : que l'on se souvienne de Trooclick, qui travaille sur son outil qui trie, filtre et évalue des données économiques, ou de Syllabs, qui "collecte, analyse et génère" des contenus spécialisés. Tout ceci est bien froid, pensez-vous ? Quel rapport avec le journalisme ou l'écriture, finalement ? Et pourquoi pas, tant qu'on y est, un algorithme pour nous donner son sentiment sur Louis-Ferdinand Céline. "L'Amour c'est l'infini mis à la portée des caniches" , il en dit quoi, Monsieur l'Algo ? Le style ne se décrète pas. Mais manifestement, tout s'apprend. Conversation avec Quentin Pleplé, de Short Edition.  

Pour ceux qui ne sont pas encore partis en vacances, vous avez peut-être vu passer, entre deux courriels et trois RT, le tweet (de la discorde #OuPas) de @Actualitte

Comme ça, tout simplement. 

Après avoir appris à trier, filtrer, géolocaliser, taguer, voire vérifier, les algorithmes pourraient donc apprécier les vertus d'un texte ?

C'est à peu près le credo de Short Edition. Encore que. Comme toujours, l'affaire est plus complexe. Pour répondre aux besoins de cette petite affaire éditoriale plutôt familiale souhaitant devenir le "YouTube de la nouvelle",  Quentin Pleplé (formé à Polytechnique puis aux Etats-Unis) s'est donc entouré de trois laboratoires de recherches (amis des acronymes, voici la clé : le LIG de Grenoble, l'IRIS de Lyon, le LIMSI d'Orsay) mais aussi - et surtout - de son comité éditorial pour fabriquer l'outil qui sied à son ouvrage.

  • Pourquoi ?

La maison d'édition reçevant désormais 2 000 nouvelles, en moyenne, par mois, il s'agit non pas de remplacer, mais de soutenir le travail du comité éditorial en améliorant la circulation de la copie. En un certain sens, on n'est pas loin d'un outil d'aide à la décision éditoriale

  • Comment ? Et kézako que ces algo(s) ?

Short Editions travaille donc sur deux algorithmes :

  1. Le premier sert à filtrer, thématiser, catégoriser. Qui dit communauté(s) (de goût et de lecteurs), dit nécessité de répondre à un certain nombre de critères. Le flux doit être bien routé.
  2. Plus intéressant, le deuxième algorithme (on aurait presque envie de l'appeler Pivot !) se charge de la "pré-analyse de la qualité littéraire".     

Oui, et c'est là que ça devient intéressant : ce dernier ne repère pas, en réalité, les qualités (supposées ou réelles) des oeuvres à venir, mais bien plutôt détecte la "non-qualité" : "un texte bourré de fautes d'orthographes, un trop plein de points d'exclamation, ou une série de lettres se répétant comme dans "cooooooooooooool"", explique Quentin Pleplé. En somme, l'idée, c'est juste d'identifier ce qui, statistiquement, ne marche pas.  

Bravo, pensez-vous ? Et quid des auteurs qui pratiquent la langue orale et ne seront pas repérés ?
De celles et ceux qui inventent peut-être un nouveau nouveau roman tramé de textos, de lolcats et de mèmes ?
De ces OVNIS littéraires jouant sur de nouvelles infra-basses pour ausculter les entrailles de nos âmes définitivement perdues ?     

Qu'on se rassure, le sentier est balisé. Par un bon vieux circuit éditorial qui prévoit deux hypothèses :

  • Si l'algo-Pivot attribue de bonnes ou de très bonnes notes, la nouvelle est lue par 10 personnes avant décision.
  • Si l'algo-Pivot fait grise mine, 3 personnes vérifient. Et s'ils estiment qu'il s'agit là d'une sorte de cygne noir, hop, on le remet dans le circuit éditorial commun.  

Dit autrement par Quentin Pleplé, "si l'on tombe sur La Disparition de Pérec [écrit sans "e"], de toute façon, la machine ne s'y retrouve pas, mais le comité reste là pour filtrer."   

Et comme personne n'a la science infuse, à commencer par les machines qui ne font que répondre à des questions pour lesquelles on les a formées, l'enjeu est "simple" : il faut élaborer les critères correspondant au jugement de goût de la communauté de lecteurs. "On ne prétend pas avoir des oeuvres qui font des cartons. On a en revanche un panel représentatif de ce que la communauté peut produire" . Et c'est aussi là que tout se joue : nous parlons bien du "YouTube de la nouvelle", il s'agit donc de consacrer le règne des amateurs et d'animer la vie d'une forme de communauté littéraire (avec, sans doute, le risque de clôture sur soi, certes, que l'on peut y déceler, comme l'expliquait à sa façon Gerald Bronner dans La Démocratie des crédules), et non de penser pouvoir scientifiquement repérer le style (le grand !) de demain.   

L'inspiration, en somme, est (à peu près) sauve. 

Ce que conforte, d'ailleurs, le corpus permettant à l'algorithme Pivot de se frotter avec la fine fleur des futurs auteurs : il ne s'agit pas de partir de Gallica ou de la BNF pour avoir une sorte d'histoire de la littérature en bandoulière en guise de viatique pour arpenter la jungle des manuscrits reçus, mais bien de l'ensemble des nouvelles publiées et des nouvelles reçues par Short Edition pour conforter la construction de son catalogue. 

Pour les aventuriers du style et les créateurs de formes inattendues, pas de miracle : l'artisanat reste de rigueur. 

Mais notre atelier médiologique continue de changer : si l'on ne veut pas que l'innovation soit un vain mot (Cf. ce très bon petit billet : "Innovation partout, innovation nulle part"), la question est toujours là même. Dompter les technologies. Jusques et y compris dans les rédactions. Comme disait Debray, voilà l'enjeu : "pouvoir inventer et savoir hériter"

 

 

---

Crédit image : @Alan Light (Licence CC-BY-SA 2.0) 

Commentaires

Portrait de Prediksi Bola

Hi admin ... i really like your pic ... its full of information .. thanks for sharing this article ... Look Prediksi Bola

Portrait de Prediksi Skor

this very interesting... thanks for share this article.

 

Prediksi Skor Bola

Portrait de how can you get more likes on instagram

The first is used to filter, thematize, categorize. Who says community (s) (taste and readers) says need to meet a number of criteria. The flow should be routed well. More interestingly, the second algorithm (you would almost want to call Pivot!) Is responsible for the "pre-analysis of literary quality."

how can u get more likes on instagram

Portrait de berita bola

More interestingly, the second algorithm (you would almost want to call Pivot!) Is responsible for the "pre-analysis of literary quality

Berita bola

Portrait de Agen Tangkas

Uefa88 Merupakan Agen Tangkas Terpercaya, Agen Tangkas, Agen Bola Tangkas yang telah memiliki banyak membernya yang tersebar di seluruh Indonesia, http://uefa88.net selalu memberikan bonus yang sangat menarik bagi para pendaftar, untuk mendaftar silahkan kunjungi website uefa88 di http://goo.gl/QertC3

Portrait de Absensi Sidik Jari

i think ur information its great, thanks for share

 

regards

Mesin Absensi Sidik Jari | Absensi Sidik Jari

 

Post new comment