Giới thiệu Text-chunking là bài toán chia một văn bản thành các cụm thành phần có liên quan tới cú pháp. Ví dụ, trong câu: “He reckons the current account deficit will narrow to only # 1.8 billion in September." có thể được phân tích thành như sau:
[NP He ] [VP reckons ] [NP the current account deficit ] [VP will narrow ] [PP to ] [NP only # 1.