Category Archives: Internet - Page 2

Travail et jeux

J’ai pu voir cet été la vidéo d’une conférence de Luis Bon Ahn, intitulée Human Computation. Il est parti du principe que les gens s’amusent beaucoup avec des jeux parfois assez simples, comme le solitaire par exemple. Alors, pourquoi ne pas utiliser le fait que les gens jouent à ces jeux pour effectuer des tâches que l’humain peut faire mais que l’ordinateur ne sait pas faire ?

Dans son exemple, il cherche à caractériser des images. Si on fait une recherche de « chien » dans google image par exemple, on va trouver des images qui sont à proximité du mot chien dans des pages web, mais il est fort possible que l’image ne soit pas un chien. L’ordinateur ne sait pas distinguer un chien dans une image. Il se base uniquement sur le fait que c’est une image et qu’elle est à proximité du mot (ou s’intitule) chien. Il propose alors de faire un jeu permettant aux gens de s’amuser et de donner un mot caractérisant une image. Ce jeu a été programmé, et se joue en ligne, à deux. Les deux personnes voient une image, et doivent taper des mots correspondants à l’image. Dès que les deux personnes trouvent un mot en commun, elles marquent un point. Si les deux personnes écrivent le mot chien on peut raisonnablement penser que l’image contient un chien. Et si un grand nombre de personnes trouvent aussi ce mot, celà valide d’autant plus la pertinence du mot chien.

Ce qui est étonnant est que ce jeu présent en ligne est un gros succès. On constate que, même pour un jeu aussi simple, certains joueurs y passent littéralement leur journée. Et le résultat est intéressant puisqu’il permet d’effectuer une tâche impossible à réaliser sans l’apport humain.

Je n’ai pas retrouvé le lien de la conférence que j’ai suivie (elle m’a été donnée téléchargée), mais j’ai vu que l’auteur l’avait également donnée chez les gens de chez Google (attention, c’est en anglais):

D’ailleurs, on peut voir que depuis quelques jours, Google propose lui aussi un jeu pour identifier des images : http://images.google.com/imagelabeler/

Il n'a de libre que le nom.

Peut-être avez vous entendu parlé de l’article de Mr Jean Dominique Giuliani intitulé Il n’a de libre que le nom et qui a notamment été publié par Libération. Je vous invite à le lire, si ce n’est pas déjà fait. En effet, il contient des éléments assez caractéristiques et que je rencontre régulièrement chez des gens qui ne connaissent pas ou mal le logiciel libre.

Mr Giuliani fait en effet l’amalgame dangereux entre gratuité et liberté. En effet, il part du principe qu’un logiciel libre est gratuit, et parce qu’il peut être redistribué gratuitement, il a été réalisé également gratuitement. Le problème est que son approche ne correspond pas à l’industrie du logiciel libre que l’on rencontre sur le terrain. Si on prend des exemples comme le noyau Linux, souvent montré en exemple, on se rend vite compte que les principaux développeurs du logiciel sont tous salariés pour travailler sur ce projet (par des sociétés comme RedHat, IBM, Novell, ARM ou d’autres). Un logiciel comme MySQL est également développé par une entreprise commerciale, qui salarie ses développeurs pour travailler sur le projet. Et on peut continuer comme ça pour d’autres grands projets, comme le système de fichiers ReiserFS, ou la suite OpenOffice.org.

La liberté du logiciel libre ne repose pas sur la gratuité, sinon on parlerait de logiciels gratuits et non pas de logiciels libres. Et les anglo-saxons ne préciseraient pas « free as in free beer » (free comme dans bière gratuite) ou « free as in free speech » (free comme dans liberté de parole) si justement l’amalgame n’était pas problématique. Il faut dire qu’ils utilisent le même mot pour gratuité et liberté, ce qui ne simplifie pas leur compréhension… La gratuité du logiciel libre présenté par Mr Giuliani n’est qu’une confusion née de la méconnaissance qu’il a du sujet.

De plus, non content de confondre logiciel libre et logiciel gratuit, on retrouve également une confusion avec les freeware. Dans le logiciel libre, l’auteur du logiciel en reste propriétaire, et la protection intellectuelle associée à son logiciel est la même que s’il avait édité un logiciel propriétaire. Il a juste choisi, dans un cas de ne pas donner accès au code source de son logiciel, et dans l’autre cas, a autorisé un accès au code source du logiciel à des fins d’amélioration, d’éducation de personnalisation etc. Mais il reste l’auteur du logiciel, et en fait ce qu’il veut.

Pour ce qui est de l’affrontement des sociétés de services face aux éditeurs de logiciels propriétaires, on constate en effet aujourd’hui une mise en opposition du service face au logiciel. Ceci pose un problème de taille. En effet, celà laisse supposer que les logiciels propriétaires ne nécessitent pas de services pour fonctionner, et que de faire appel à un éditeur de logiciels propriétaires pour acquérir la licence nécessaire à ce logiciel permet de planifier et de maîtriser le temps et l’amortissement de ces logiciels. On peut rêver, mais ce n’est pas réaliste. Les personnes offrant du service sur des logiciels propriétaires comme Oracle, SAP ou même Microsoft dont le but est que le logiciel se suffise à lui même, ne manquent pourtant pas de travail. De ce coté là, le logiciel libre n’est pas fondamentalement différent. Il a besoin de service pour être configuré, adapté, intégré à l’existant. Comme les autres. Ni plus, ni moins.

Pour résumer le tout, on peut dire que le logiciel libre n’a rien de gratuit, et n’a pas été présenté comme tel par toutes les personnes connaissant un minimum le logiciel libre. Que l’accès au code source, ne viole pas la propriété qu’en a l’auteur du logiciel. Et enfin, que le logiciel libre n’est pas le seul à avoir besoin de service pour être adapté à l’environnement et à l’utilisation qui doit en être faite, c’est le cas de tous les autres logiciels. Quant à parler du prix, si l’exemple du ministère des finances est donné dans l’article, il doit bien faire sourire les acteurs informatiques français. Un projet de 39 milions d’euros, sur trois années (cas du projet copernic du ministère des finances) n’en fait pas, et de très très loin, les logiciels les plus chers de l’histoire… Il suffit de comparer ça aux 78 milions d’euros dépensés simplement en licences logicielles (sans le service) dépensées pour la seule année 2002 par le ministère des finances (source).

DADVSI, ou comment faire n?importe quoi

Difficile de ne pas en avoir entendu parler, en ce moment en France se joue l?avenir de la diffusion de la culture sur support numérique. Un premier coup de tonnerre avait eu lieu fin décembre, quand le gouvernement souhaitait faire passer le texte, en soirée à la veille de Noël, avec le vote du premier article instituant le principe d?une Licence Globale. Si cette licence globale ne me semble pas vraiment une bonne idée, l?attitude du ministre de l?industrie de la culture me semble une plus mauvaise idée encore. En effet, au redémarrage des débats la semaine dernière, il a pris la décision d?enlever l?article 1 de la loi, alors que celui ci avait été voté. Et devant l?inconstitutionnalité de la chose (forcément, faire disparaître un article ayant été voté, sans aucune discussion??) l?article a été réintroduit en fin de soirée, et supprimé rapidement par les députés présents dans l?hémicycle, lors d?un boycott de l?opposition.
Alors, si il y a beaucoup à dire sur la présence obligatoire des DRM dans les morceaux de musique téléchargeable, et leur utilisation obligatoire également, sur les restrictions à la copie privée, on peut vraiment se poser des questions sur la finalité de cette loi. En effet, il va être possible de sanctionner le téléchargeur d?une amende de première classe (le prix de deux CD environs). Mais celà n?arrêtera en aucun cas les gens de télécharger. Pour le prix de deux CD, ils pourront remplir leur discothèque. De plus, le téléchargement est largement entré dans les moeurs, principalement chez les plus jeunes. Alors, si de grandes campagnes de verbalisations auront sans doute lieu, elles rapporteront un peu d?argent à l?état, mais les artistes ne verront rien passer du tout.
De plus, devant les limitations imposées par les DRM, qu?est-ce que les gens préfèreront faire ? Acheter légalement une musique sur Internet, et se retrouver limité quant à l?utilisation de ce morceau (un morceau acheté sur le site d?Apple est lisible uniquement sur l?ordinateur ou sur un iPod, et pas sur un autre lecteur MP3), ou télécharger illégalement le morceau sur un réseau P2P et pouvoir en profiter pleinement ? Bien sûr, le ministre annonce qu?il veut forcer à l?interropérabilité des DRM sur les différents matériels. Mais c?est un voeu pieux. Comment forcer des entreprises comme Microsoft ou même Apple qui réalise 60% de son chiffre d?affaire grace à la musique, à changer complètement leur technologie de DRM. Et quid des utilisateurs de logiciels libres comme Linux qui ne pourront avoir accès à ces fichiers DRM. Encore une fois, le ministre annonce que les logiciels libres pourront y avoir accès, qu?il ?suffit?? d?y implémenter les DRM, mais il n?y a pas vraiment de solution technique existante permettant de faire ce genre de choses (le logiciel libre repose sur la publication des sources du logiciel, une sorte de recette de cuisine du logiciel, mais la publication des sources de la partie DRM ne serait pas légale?? donc pas présente dans un logiciel libre).
On se retrouve donc aujourd?hui face à un projet de loi qui sera totalement inapplicable en raison d?une part du nombre de personnes téléchargeant de la musique aujourd?hui, et d?autre part des contraintes économiques imposées aux différentes entreprises commercialisant de la musique en ligne. ? vouloir satisfaire les géants de la musique (puisqu?ils vont pouvoir vendre encore plus de morceaux, plusieurs fois les mêmes aux même personnes d?ailleurs), on se retrouve avec un texte qui n?a aucun sens.

Google, backstage

Il y a quelques mois, le 20 octobre pour être précis, Jeff Dean, ingénieur chez Google, a donné une conférence à l’université de Washington sur l’infrastructure utilisée par google, ainsi qu’un certain nombre de problématiques et d’approche pour les résoudre. La conférence est disponible en vidéo, donc forcément en Anglais. On peut la trouver sur le site de la Washington University. La conférence a quand même une durée d’une heure, donc prévoyez assez de temps.

Les informations présentées sont assez variées. Mais ce qui est le plus impressionnant dans cette présentation, est les quelques statistiques que l’on peut tirer du traitement du Web par Google. Par exemple, en comptant qu’il y a environ 4 000 000 000 (4 milliards de page, d’une taille moyenne de 10 ko, ça nous fait quand même une quantité d’informations de l’ordre 40 000 Go à traiter (soit environ 40 Péta octets…).
De même, on savait que Google utilisait une multitude de petites machines pour traiter ces informations. Il a donc fallu développer un système de fichiers permettant de travailler avec ces machines pour stocker autant de données. C’est le GFS, Google Filesystem. On en entend épisodiquement parler, et on a là un rapide descriptif de leur approche d’un système de fichiers distribué tolérant aux pannes. Car forcément, à utiliser des milliers de machines dans un cluster, il faut compter des pannes quotidiennes, qui ne doivent pas empêcher le bon fonctionnement du moteur.

Et puis, dans le genre de statistiques surprenante, une simple recherche sur la page de Google nous donne le résultat en faisant travailler pas loin d’un millier de serveurs pour la requête !

? l’origine, j’ai trouvé le lien de la conférence sur le site de WebRankInfo

WordPress 2, c'est plus pareil, mais c'est pareil !

Bon, alors c’est vrai que ça change pas grand chose, le thème reste le même, les articles sont là, mais derrière, exit WordPress 1.5, bonjour WordPress 2. Alors, pour les changements, ça se passe surtout pour moi, et avec un peu de chance, ça va me faire pondre des billets un peu plus fréquents… Mais bon, c’est pas gagné ça.

Alors, au menu de WordPress 2, c’est déjà l’intégration d’une interface de type AJAX pour que je prépare les articles. Alors, forcément, si j’utilise des gros mots, tout le monde ne va pas comprendre… AJAX, c’est un truc qui va permettre de travailler sur un site web comme si on était sur un programme en local, ça permet le même type d’interactivité. Enfin, vous pourrez trouver une définition sur Wikipedia, mais je suis pas sûr qu’elle soit tellement pour les néophites ! C’est donc plus joli et facile à utiliser.