Detectar el idioma de cualquier texto con PHP

LanguageDetector es una clase PHP, gratuita, para detectar el idioma de cualquier texto de forma automática.

detectar idioma con PHP

Esta clase tiene varias aplicaciones, una de ellas es automatizar el proceso de detección de idioma en una base de datos que debemos organizar. Su utilización es de lo más sencilla. Una vez que tenemos el modelo creado (hay un archivo de ejemplo en la descarga), simplemente escribimos algo como lo siguiente:

// register the autoloader
require 'lib/LanguageDetector/autoload.php';

// we load the language model, it would create
// the $config object for us.
$detect = new LanguageDetector\Detect('language.php');

$lang = $detect->detect("Agricultura (-ae, f.), sensu latissimo, 
est summa omnium artium et scientiarum et technologiarum quae de 
terris colendis et animalibus creandis curant, ut poma, frumenta, 
charas, carnes, textilia, et aliae res e terra bene producantur. 
Specialius, agronomia est ars et scientia quae terris colendis student, 
agricultio autem animalibus creandis.")

var_dump($lang);

Eso es todo 😀

Es interesante ver el funcionamiento interno de esta clase escrita en PHP. Cuenta con un pequeño algoritmo, que el autor define como una especie de PageRank, para clasificar y comparar las distintas palabras que componen el texto y así poder concluir el idioma en el que se encuentra escrito.

Web: LanguageDetector

Categorizado en: