Detectar el idioma de cualquier texto con PHP

LanguageDetector es una clase PHP, gratuita, para detectar el idioma de cualquier texto de forma automática.

Esta clase tiene varias aplicaciones, una de ellas es automatizar el proceso de detección de idioma en una base de datos que debemos organizar. Su utilización es de lo más sencilla. Una vez que tenemos el modelo creado (hay un archivo de ejemplo en la descarga), simplemente escribimos algo como lo siguiente:

// register the autoloader
require 'lib/LanguageDetector/autoload.php';

// we load the language model, it would create
// the $config object for us.
$detect = new LanguageDetector\Detect('language.php');

$lang = $detect->detect("Agricultura (-ae, f.), sensu latissimo, 
est summa omnium artium et scientiarum et technologiarum quae de 
terris colendis et animalibus creandis curant, ut poma, frumenta, 
charas, carnes, textilia, et aliae res e terra bene producantur. 
Specialius, agronomia est ars et scientia quae terris colendis student, 
agricultio autem animalibus creandis.")

var_dump($lang);

Eso es todo 😀

Es interesante ver el funcionamiento interno de esta clase escrita en PHP. Cuenta con un pequeño algoritmo, que el autor define como una especie de PageRank, para clasificar y comparar las distintas palabras que componen el texto y así poder concluir el idioma en el que se encuentra escrito.

Web: LanguageDetector

Pablo: Programador desde hace más de 11 años, adicto a internet, cafeinómano, fanático de la información, intento de emprendedor, trabaja de forma compulsiva solo en lo que ama. Sueña con tener una aplicación con más de 1 millón de usuarios.
Entradas relacionadas