股票招股说明书中都会提到上市公司的市场竞争情况和竞争对手。要研究企业,就必须仔细研究竞争对手。怎么将竞争对手这些信息批量从招股说明书中提取出来呢?
首先观察其规律:
有的是这样写的:
行业内的主要企业:浙江芯能光伏科技股份有限公司
有的是这样写的:
发行人主要竞争对手情况(根据相关公司公开披露的信息整理)
国内金融 IT 解决方案行业的市场集中度不高,市场处于充分竞争局面,主要企业的细分领域也有所不同,公司的主要直接竞争对手有文思海辉、科蓝软件、赞同科技、宇信科技、南天信息、汉克时代、东软集团;其他同行业竞争对手有长亮科技、安硕信息、京北方等。
有的是这样写的:
主要竞争对手
按照市场化程度,我国大中型钢结构企业可以划分为两类:一类是以精工钢构、富煌钢
构、杭萧钢构、鸿路钢构、海波重科和本公司等为代表的民营企业,面向市场独立经营;另
一类是以中建科工集团有限公司为代表的国有大中型钢构企业,主要是为系统内工程建设提
供配套,故在市场上与本公司竞争的主要是部分国有大中型钢构企业及精工钢构、富煌钢构、
杭萧钢构、鸿路钢构、海波重科等大中型民营钢结构企业。
有的是这样写的:
行业内的主要企业
发行人是创意包装企业,主营业务包含产品形象设计服务和创意包装产品的研发、生产及销售。国内专注于创意包装形象设计服务的企业相对较少,尚未形成规模较大的企业。发行人创意包装产品的研发、生产及销售业务主要竞争对手包括深圳市裕同包装科技股份有限公司、上海艾录包装股份有限公司、深圳市美盈森环保科技股份有限公
因此,共同规律是都会出现关键词:“行业内的主要企业”或者“主要竞争对手”。
由此,可以在ChatGPT中输入这样的提示词:
写一段Python代码,完成提取PDF文本的任务,具体步骤如下:
F盘“北交所全部上市公司的招股说明书20230710”文件夹内有很多个PDF文件,读取PDF文件标题,保存为变量:shuomingshutitle;
读取这些PDF文件,检查每一页的文本内容中是否包含关键词:“行业内的主要企业”或者“主要竞争对手”;
如果存在关键词,则将对应的章节内容保存到F盘“北交所全部上市公司的竞争对手”文件夹下的:”{shuomingshutitle}竞争对手.txt”
注意:每一步都要输出信息
在vscode中运行Python程序:
提取的竞争对手内容如下: