Nltk tokenizer issue

29 Views Asked by Manikanta At 21 October 2025 at 05:50

from nltk.tokenize import RegexpTokenizer
tokenizer = RegexpTokenizer(r'\w+')
dataset['text'] = dataset['text'].apply(lambda word_list: [tokenizer.tokenize(word) for word in word_list])
dataset['text'].head()

The above code shows an error

expected string or bytes-like object, got 'list'

There are 0 best solutions below