Un kilo-ien plus tard…

Alors que je trie mon millième ien, je me dis que c'est un moment comme un autre pour se tourner vers l'arrière et regarder le chemin parcouru.

Motivations initiales

J'ai déjà décrit tout ça en détail dans mon billet iens en vrac et à l'unité, mais en résumé fin 2023 j'ai fait le constat que j'accumule n'importe comment des liens à regarder plus tard, et j'ai développé une application qui les range dans une base de données.

Le but de cette application était donc ostensiblement de mieux organiser les articles que je garde pour plus tard et de noter quelques conclusions après les avoir dépilés.

Cependant le contexte qui a lancé cette application était quand même le constat que je gardais (beaucoup) trop de liens « pour plus tard » sans ce que ce « plus tard » semble proche d'arriver. Il y avait donc le constat diffus que je gardais plus de trucs que j'étais capable de traiter, et j'espérais que cette application permette de mettre en évidence ce problème et de le résoudre.

J'espérais que la résolution se fasse par les deux côtés :

En particulier, j'imaginais que le système de tags que j'attache a posteriori aux articles que j'ai lu permette de se faire une meilleure idée a priori de ce qui est pertinent à garder pour plus tard.

Accumulation en un an et demi

Je ne dirais pas que c'est un échec, mais ça n'a pas marché.

Emmanuel Macron

J'ai donc dépilé mon millième ien le 25 juillet 2025, après 572 jours d'utilisation de mon application. Ce qui fait une moyenne générale de 1.75 iens par jour.

À ce moment-là, j'avais 1212 iens enregistrés dans ma base de données, soit une pile‐à‐lire de 212 iens, ce que je trouve énorme.

Et cette pile ne s'est pas faite en un jour, voyez plutôt :

Taille de ma pile‐à‐lire au fil du temps

La partie fin 2023 est la pile‐à‐lire initiale pour lancer l'outil, on voit les premières semaines de mise en place en janvier, puis le début de l'accumulation dont j'avais parlé dans le premier billet, puis une stabilisation un peu au-dessus de 50 iens parce que j'ai fait des efforts pour redresser la situation.

Je ne sais pas exactement ce qui a changé à l'automne 2024, mais la pile‐à‐lire a manifestement subi une croissance continue jusqu'en avril 2025, où j'ai à nouveau repris les choses en main, mais encore une fois sans vraiment résorber de dette. Ce n'est qu'à la faveur des congés de juillet que j'ai pu faire visiblement descendre la courbe, comme les deux nettes baisses de 2024.

On retrouve la même chose en distinguant les flux entrant et sortant, avec un lissage exponentiel sur 30 jours, sinon la variabilité d'un jour à l'autre jette des points tout partout sur tout le graphe :

Nombre moyen de iens créés ou lus par jour

À quelques exceptions près, je n'arrive juste pas à lire suffisamment de iens par rapport à ce que je mets de côté ; au mieux je frôle l'égalité.

La moyenne de 1.75 iens par jour cache une période active, vers 2 iens/j, et un effondrement à l'automne plutôt vers 1 ien/j, avant de remonter péniblement jusque vers 1.5 iens/j.

Et pendant ce temps, je relève environ 2 iens par jour qui ont l'air intéressants.

La conclusion est implacable : des iens bien rangés dans une appli' ne m'incitent pas tellement à lire plus, ou du moins pas durablement, et ils ne m'incitent pas non plus à être plus regardante sur ce que je mets de côté.

L'explication est assez simple : l'application a une place dédiée dans mon tmux principal, donc je n'y accorde d'attention que lorsque j'y vais volontairement, lorsque j'ai du temps libre à y consacrer. Donc le débit sortant est largement déterminé par des circonstances qui me sont extérieures, peu importe la taille de la pile‐à‐lire. Et pendant que je dépile #gcufeed ou Bluesky, je n'ai pas l'application sous les yeux, et je mets de côté indépendamment de la taille de la pile‐à‐lire.

D'un autre côté, les variations de débit vont globalement dans le même sens, donc je dois avoir quelque part une intuition de la quantité de ressources temporelles que je peux y consacrer ; il faudrait juste une meilleure calibration. Ou plus de temps libre, puisque les courbes semblent se rejoindre quand les deux sont suffisamment hautes.

Le fait d'avoir pour chaque ien sa date de création et sa date de tri permet de faire des graphiques sur le temps passé dans la pile‐à‐lire, mais je n'ai rien trouvé à en sortir que je ne sache pas déjà. Dans l'ensemble je dépile majoritairement des iens récents, et très rarement je vais fouiller dans les vieux iens, et c'est encore plus rare depuis l'effondrement d'automne.

Si vous avez des idées intéressantes d'analyse de ces données, n'hésitez pas à me faire part de vos suggestions, j'ai l'impression que je suis loin d'avoir vu tout ce qu'il y a à en tirer.

Rangement des iens

Je vais commencer par le positif : je ne m'attendais pas à ce que cette application me soit aussi utile pour retrouver des articles passés.

Par rapport à l'ancien système, où après lecture il ne restait globalement plus que des informations dans ma tête, la combinaison des mots-clés dans l'URL et dans la petite description que j'écris me permettent de retrouver des références à partir du vague souvenir que j'en ai, et ça m'a plusieurs fois été très précieux.

En revanche, le système de tags que j'avais mis en place pour aider au rangement c'est révélé être une grande déception.

Tels qu'ils existent aujourd'hui, ces tags mélangent quatre types d'informations assez différentes :

Malheureusement, l'attribution (manuelle) de ces tags me semble tellement pourrie que je me méfie de toute information que je pourrais en extraire. Parfois ils m'aident à retrouver un article dont mon souvenir est trop vague pour donner des mots-clés utiles, mais je pense qu'un BM25 du texte me rendrait plus de services.

La source

Les tags source sont les plus fiables, parce qu'ils représentent une réalité objective enregistrée pour chaque entrée, mais ils sont aussi pratiquement inutiles tout seuls.

J'avais choisi de les inclure dès le début parce que j'avais l'impression que Lobsters est plus proche de mes centres d'intérêt que Hacker News, et je voulais vérifier et quantifier cette impression.

Mon intérêt

Malheureusement, les tags qui représentent mon intérêt font partie de ceux envers lesquels j'ai le plus de doutes.

J'étais partie avec une note sur 5, où un article « normalement intéressant » a 4, un qui m'enthousiasme inhabituellement a droit à 5, alors que s'il y a des morceaux pénibles ça tombe à 3. J'attribue 2 quand l'article dans l'ensemble me semble dispensable, au point que j'aurais préféré ne pas passer de temps à le lire, alors qu'il contient quand même quelques points intéressants. Alors qu'un 1 signifie une perte de temps complète.

Au tout début, j'avais imaginé que mes liens en vrac compteraient comme un 6, genre je suis tellement enthousiasmée que je les partage. Ça n'a tenu que quelques mois, et dès le numéro 11 mes liens un vrac sont un sous-ensemble relativement gros de la note 5.

Le plus gros problème, c'est que ce système de notation n'est pas très informatif, puisque les deux tiers des articles ont un 4 :

Répartition des 1000 iens triés par intéret

Et c'est même pire que ça, parce que je soupçonne que la différence entre un 3 et un 4 dépende plus de mon humeur du moment que des qualités intrinsèques de l'article par rapport à ma subjectivité personnelle.

En y ajoutant le fait que c'est rare que j'arrive au bout d'un article complètement inintéressant, donc en réalité il n'y a vraiment que trois catégories plutôt que six : extrêmement intéressant ou peu intéressant, à 4 % chacun, et commun pour les 92 % restants.

Comme je me suis embêtée à faire la ventilation des notes par sources, je vous partage le graphique, même si je ne trouve pas grand-chose à en dire :

Répartition des 1000 iens triés par intéret et par source

Il y a bien un léger décalage en faveur de Lobsters, mais à ce stade ça pourrait être un biais personnel aussi bien qu'un vrai signal.

Je pense que la différence entre Lobsters et Hacker News est plus flagrante en amont : sur les 106 329 liens qui sont passés sur #gcufeed pendant ces 572 jours, il y en a 40 290 qui viennent de Hacker News, contre 13 200 qui viennent de Lobsters. Donc mon intuition de l'intérêt en ne voyant que le titre a l'air assez bien calibrée.

En passant, maintenant que j'ai sorti ces nombres, je suis étonnée d'être à ce point sélective sur les liens de #gcufeed que je suis. Je m'attendais à quelque chose comme 10 %, voire plus, alors que c'est plutôt de l'ordre du pourcent.

Les qualificatifs

Je mélange un peu les tags de fond et les tags de caractéristiques, et ça ne me semble pas très satisfaisant, mais c'est loin d'être ma seule source d'insatisfaction.

Ce qui me déplaît le plus, c'est que je n'arrive pas toujours à penser à tous les tags appropriés, et il n'y a pas vraiment de catégories que je pourrais systématiquement vérifier.

Résultat, si j'attribue un tag à un article, j'ai raisonnablement confiance dans le fait qu'il s'applique (quoiqu'avec les difficultés habituelles des limites floues), mais l'absence d'un tag ne veut pas du tout dire qu'il ne s'applique pas.

Je n'ai donc pas l'impression de pouvoir tirer de conclusion des populations de tags.

En plus pour mon utilisation personnelle, à chaque fois que j'ai essayé d'utiliser les tags pour affiner mes recherches d'un article dont j'ai un vague souvenir, ça ne m'a rien apporté, et dans beaucoup de cas ça m'a même ralentie, en comptant sur un tag qui n'était finalement pas là.

La publication

Après avoir tellement critique ce système de tags, on pourrait raisonnablement le penser condamner. En tout cas pour mon utilisation personnelle, les tags ne méritent pas l'effort de les poser.

Cela dit, les tags sont publiés dans mes flux Atom, sous forme de catégories, et ils sont peut-être utiles à quelqu'un qui suivrait ces flux. J'invite donc cette éventuelle personne à se manifester, parce que ça me demande suffisamment peu d'effort pour consentir à entretenir le système actuel s'il sert à qui que ce soit.

Et si vous avez des idées pour l'améliorer, je suis toute ouïe.

Appel au public

Dans tout ce qui précède, j'ai bien détaillé tout ce que fait pour moi mon gestionnaire de iens. C'est avant tout une application pour moi, qui a ses défauts, mais qui remplit un rôle précieux dans l'organisation des informations que je choisis de suivre.

Il y a des sous-produits que sont les flux Atom des iens dans ma pile‐à‐lire, des iens lus et classés, et des iens tellement bien qu'ils sont ou seront dans un billet « en vrac ». Ces flux ne me servent à rien, puisque j'ai tout ça dans l'application.

Je fais donc appel à vous, cher public, sur l'intérêt et les éventuelles évolutions de ces flux. Y a-t-il au moins une personne qui se sert de l'un de ces flux ?

Ils me demandent tellement peu d'effort, qu'une seule personne utilisatrice suffirait largement à justifier leur existence, mais s'ils n'intéressent littéralement personne, ils risquent de disparaître la prochaine fois qu'ils réclament mon attention.

Et si quelqu'un s'en sert, est-il ou sont-ils satisfaisants ? Puis-je faire quelque chose pour faciliter leur utilisation ? Les tags ou catégories ont-elles le moindre intérêt ?

Dans un certain sens, les billets En vrac sont aussi des sous-produits de l'application, et le dernier commentaire de Balise est une indication suffisante pour que je préserve cet aspect de l'application et de mon weblog.

Commentaires

Pas de commentaire pour le moment.

Poster un commentaire

Mise en forme historique : pour mettre en valeur un mot ou un groupe de mot, tapez une étoile de part et d'autre, sans mettre d'espace entre l'étoile et le mot, comme ceci : *mise en valeur*. Pour insérer un lien, mettez le entre crochets, comme ceci : [http://instinctive.eu/].

Mise en forme markdown : voir le guide détaillé, en résumé c'est le Markdown traditionnel, sans HTML ni titres, mais avec les tables PHP-Markdown-Extra.

Attention : les balises HTML entrées dans les commentaires seront affichées telles quelles, et non pas interprétées.

Autour de cette page

 

Autour de cet article

Derniers commentaires

Tags

Archives

Site-level navigation and features

 

Instinctive.eu

Contact

Sections

Validation

Copyright © 2008-2025 Natacha Kerensikova

Butterfly images are copyright © 2008 Shoofly