事情起因
学堂在线
工程伦理课程
在线学习,没有课件, 考试的时候可能会不方便,做一解决此类问题
字幕下载 合成为Txt 文件或者word 文件以供学习使用
事情经过
- 首先想到的是自己写一个爬虫 怕区相应的字幕, 发现是文本形式存储和, 很好做, 但是涉及到登录的cookie信息, 暂时不会,没有做 同时找到了 github上一个爬取学堂在线字幕的项目1 需要简单配置cookie即可, 没有测试, 之后测试一下
- 找到一个blog 提供的一个简单的js 版本的字幕下载2 下载得到的是srt 字幕格式, 不过下载得到的文件是按照后台的文件名存储的, 跟课程顺序 有所不同, 切部分无法获取到完整用户名
-
手工将文件 重命名 之后 使用程序将 可以找到相应的srt转成相应的纯txt文本文件 此处有一个C++ 版本的srt转txt3
-
此处提供其他的视频或者字幕下载工具,可以之后尝试下载4
https://github.com/maxujie/xuetang-down ↩︎
http://corie.cn/2016/09/29/mooc-js/ ↩︎
https://blog.csdn.net/TimoTolkki1966/article/details/80783801 ↩︎
https://blog.csdn.net/jiandanjinxin/article/details/23679869 ↩︎