Publication: Non-standard words as features for text categorization.