pyECTOR 0.2 est sorti!
L'analyse des phrases marche
Mots-clés : ECTOR, python, bot Parlant, réseau de concepts
J'adore les longs week-ends calmes. J'ai pu avancer dans le développement de pyECTOR. Je m'étais dit que dès que pyECTOR serait capable d'intégrer une phrase dans son réseau de concepts, j'en sortirais une nouvelle version. Voilà qui est fait.
Ce ne fut pas aussi simple que je l'avais cru (mais bon, je sais aussi qu'un développement n'est jamais aussi facile qu'il en a l'air). J'ai eu des problèmes de compatibilité entre les expressions régulières et Unicode (traduction: les cédilles, les accents et autres françaiseries disparaissaient de la mémoire d'ECTOR).
Pour résumer: on peut désormais apprendre la langue française à pyECTOR. Mais pas l'«entendre» l'utiliser. Pas encore.
J'adore les longs week-ends calmes. J'ai pu avancer dans le développement de pyECTOR. Je m'étais dit que dès que pyECTOR serait capable d'intégrer une phrase dans son réseau de concepts, j'en sortirais une nouvelle version. Voilà qui est fait.
Ce ne fut pas aussi simple que je l'avais cru (mais bon, je sais aussi qu'un développement n'est jamais aussi facile qu'il en a l'air). J'ai eu des problèmes de compatibilité entre les expressions régulières et Unicode (traduction: les cédilles, les accents et autres françaiseries disparaissaient de la mémoire d'ECTOR).
Pour résumer: on peut désormais apprendre la langue française à pyECTOR. Mais pas l'«entendre» l'utiliser. Pas encore.
Feuille de route
Allez, cassons le suspens, voilà ce que j'ai prévu comme succession de versions:- v0.1: le réseau de concepts fonctionne (ça c'est fait)
- v0.2: l'analyse des phrases fonctionne (ça aussi, depuis aujourd'hui, c'est fait)
- v0.3: pyECTOR répond (mais classiquement, comme n'importe quel autre bot parlant, en ressortant des phrases telles quelles)
- v0.4: l'analyse des phrases inclue la reconnaissance des expressions (ou n-grammes) les plus fréquemment employées (en pratique, ça peut changer les choix de phrases, mais c'est tout)
- v0.5: génération statistique de phrases à partir des expressions et des mots les plus activés (et là, pyECTOR pourra faire preuve d'originalité, comme ses versions en PHP et en C l'ont déjà fait)
- ...: à partir de là, il faudra expérimenter, construire une base de connaissance convenable pour la distribuer par défaut avec le programme,
- ...: on pourra aussi envisager de le rendre disponible pour un plus grand nombre (via un site web ou une connexion à IRC, voire à Jabber; il existe un grand nombre de bibliothèques Python pour ça)
Ressources
- pyector-0.2.tar.gz
- EctorManual (en anglais, et traduit par Google)
- page du projet pyECTOR (en anglais)
Par H_I | | 11/11/2008 22:04 | IA | aucun commentaire |