一、怎么能让机器能够理解我们的语言呢,我们可以利用神经网络干很多的事情,那么我们是不是也可以用神经元做自然语言处理呢,现在很多的实际应用已经说明了这个问题,可以这么做。
那我们考虑一下该怎么做,首先我们应该把我们现实中的每一个单词都用一个词向量来进行表示:
import numpy as nponehots = {} onehots['cat'] = np.array([1,0,0,0]) onehots['the'] = np.array([0,1,0,0]) onehots['dog'] = np.array([0,0,1,0]) onehots['sat'] = np.array([0,0,0,1])sentence = ['the','cat','sat'] x = onehots[sentence[0]] + \onehots[sentence[1]] + \onehots[sentence[2]]print("Sent Encoding:" + str(x))
运行结果为:
Sent Encoding:[1 1 0 1]
这个运行结果就是代表“the cat sat”这句话。当然对于一个实际的应用来说,这个词向量的长度和词向量可以表达的内容还很少。但是我们已经知道了最基础的NLP的思想了。第一步要转化数据到我们机器可以识别的程序。