读取"D:\BaiduSyncdisk\硕士毕业相关\毕业论文数据\特征数据\合并后的文件.xlsx"
中‘提问倾向’这一列为‘高阶提问’的行,
对这些所有行的‘行为类别’这一列的数据进行扫描,
分别以每次两行和每次三行为窗口滑动扫描 得到二元的和三元的序列组,
再做降序排序平打印
import pandas as pd
from collections import Counter# 读取Excel文件
file_path = r"D:\BaiduSyncdisk\硕士毕业相关\毕业论文数据\特征数据\合并后的文件.xlsx"
data = pd.ExcelFile(file_path).parse("Sheet1") # 调整 sheet 名称为实际需要的# 筛选出“提问倾向”为“高阶提问”的行
filtered_data = data[data['提问倾向'] == '高阶提问']# 提取“行为类别”列
behavior_sequences = filtered_data['行为类别'].tolist()# 滑动窗口生成二元和三元序列
def generate_sequences(sequence, window_size):return [tuple(sequence[i:i+window_size]) for i in range(len(sequence) - window_size + 1)]# 生成二元序列
bigrams = gene