Publication: Text document clustering based on frequent word sequences.