Faça este exercício OU o exercício 14 (não é necessário fazer os dois).

É comum usar HMMs para determinar a sequência mais provável de rótulos para uma sequência de palavras. Para isto é necessário que o algoritmo saiba, a priori, a distribuição conjunta de rótulos e palavras. Normalmente, esta distribuição é aprendida a partir de um corpus rotulado manualmente.

Diga como você usaria técnicas de aprendizado não-supervisionado para treinar um etiquetador sem informar as frequências de rótulos e sem usar exemplos de texto já etiquetado. Você pode usar apenas: