Le 5 décembre 2010, Tobias Schulz a annoncé la suspension du projet pour 6 mois. Tobias doit passer au printemps 2011 son examen de fin d'étude du secondaire, ce qui l'empêche de se consacrer pleinement au projet FreeHAL@home.

Toutefois les serveurs et les paramètres du projet, les classements et le forum vont rester en ligne.

Le projet reprendra en juin 2011

 

URL du projet : http://freehal.net/freehal_at_home/

 

Depuis 2006, le programme informatique FreeHAL est le programme de dialogue capable d'apprendre le plus performant parmi les intelligences artificielles disponibles en logiciel libre (open source).

Il utilise des réseaux sémantiques et travaille avec une reconnaissance de forme, de racines, de bases de données de catégories grammaticales et de modèles Hidden Markov, pour imiter un comportement aussi humain que possible dans les conversations.
Contrairement à la plupart des robots de dialogue libres ou commerciaux, FreeHAL apprend toutefois de manière autonome. Le programme élargit sa base de données de connaissances par la communication (via le clavier).
Il supporte les langues allemande et anglaise, sachant qu'actuellement il n'existe qu'une base de données étendue - comme réseau sémantique - pour l'allemand.


Le sous-projet FreeHAL@home sert à convertir ou à générer des bases de données réparties sur le plus grand nombre possible d'ordinateurs, pour rendre utilisables pour le projet principal des faits tirés de textes disponibles sur Internet.

Concrètement, il s'agit de réseaux sémantiques qui seront contenus quelques jours plus tard dans le téléchargement officiel. Étant donné que ce travail est exécuté de manière répartie via BOINC, FreeHAL peut convertir les 4 millions de faits existants dans le bon format, en chercher de nouveaux ainsi qu'en faire l'analyse grammaticale et les convertir. Actuellement, ce sont les articles du Wikipédia allemand qui sont transformés en réseaux sémantiques, plus tard d'autres sources de données telles que les projets libres ConceptNet et OpenCyc sont prévus. En outre, des bases de données de thésaurus libres telles qu'OpenThesaurus ont déjà été converties dans leur propre format.

Étant donné que ces processus peuvent facilement être calculés de manière distribuée, BOINC s'impose. Pour les tags POS on utilise les modèles Hidden Markov et des données statistiques définies.


Une autre possibilité d'application est le résumé de texte. Vous aurez bientôt d'autres informations à ce sujet.