1. 网课汇总

0 CS140Operating Systems;
这门课主要讲操作系统,值得注意的是,编译课件的 tex文件和一些需要编译的sty文件(如dmtalk.sty)不在同一个目录,需要手动复制粘贴在同一个目录下,才能编译成功。

1 cs231n 计算机视觉 网易公开课视频
只看了李飞飞绪论的视频,把计算机发展历程介绍得很清楚,后面其他老师上,没有看。
2 cs231n 课程主页;
Convolutional Neural Network for Visual Recognition;
2019 课件页
3 cs229 machine learning;
这门课的report,如弱监督分类器,自动课程学习等 2017 project Posters and Reports

4 cs166 data structure
主要把PPT都看了一遍, 树部分的内容太多了,好像堆栈内容比较少。

5 cs 224n nlp 2018;
6 cs 224d 2016 nlp pdf;
7 IFT6266 H-2016 DEEP LEARNING(推荐);
8 stats 385 deep learning;
9 cmu deeplearning;
10CS 448B Visualization;
11 CS332: Advanced Survey of Reinforcement Learning;
12 CS 236: Deep Generative Models;
13 CS230 Deep Learning;
14 CS208e: Great Ideas in Computer Science;
15 CS221: Artificial Intelligence: Principles and Techniques
16 CS229 Machine learning(推荐);
17 CS161 Design and Analysis of Algorithms 关于算法 (推荐);
18 数据结构 学堂在线
19 算法 Coursera
20 MIT deep learning ;
21 Carnegie Mellon University, Probabilistic Graphical Models;

2. 其他资料

  1. github Mikoto10032/DeepLearning;
  2. Infoq会议
  3. 邱锡鹏 神经网络和深度学习

3. 网课PPT批量下载

http://cs229.stanford.edu/notes2020spring/ 为例:
index有各种课件在这里插入图片描述

目标是爬取这些下载链接,并保存课件。

import urllib.request   # 注意:python 3 版本没有urllib2
from bs4 import BeautifulSoup  # 解析处理网页的一个库
import os # 文件相关

url= "http://cs229.stanford.edu/notes2020spring/" #
#url = 'http://www.scs.stanford.edu/19wi-cs140/notes/' # 目标网址
page = urllib.request.urlopen(url) 
contents = page.read()   #读取内容

soup = BeautifulSoup(contents,"html.parser")#解析成soup对象
print("soup",soup)

for tag in soup.find_all('tr'): #定位到html的li标签。为什么是li呢,这需要自己看看contents里面都有什么,
	# 在这个网址中,a href 即 pdf下载链接在li标签下面。所以这里先定位到li标签
	print("tag", tag)
	all_pdf = tag.find_all('a')    # 然后定位到a标签
	print("all_pdf",all_pdf)
	try:
		first_pdf_url = url + all_pdf[0]['href'] # 因为a标签下有很多个pdf下载链接,包括课件,打印版课件,还有gz压缩包等,我现在只想要课件,所以只取第一个
		file_name = first_pdf_url.split('/')[-1] # 提取文件名
		print('Current dir is :',os.getcwd()) # 判断当前文件夹是不是已经有这个文件了,有的话就不继续下载了。
		if(os.path.exists(file_name)):
			print(file_name,'already exists, thus continuing to download next file.')
			continue
		with urllib.request.urlopen(first_pdf_url) as response, open(file_name, 'wb') as out_file: # 没有的话,打开这个pdf链接,然后开始下载
			print('Start to download the file:',file_name,'from url:',first_pdf_url )
			data = response.read() # a `bytes` object
			out_file.write(data) #把pdf内容写进去
		if(not os.path.exists(file_name)): # 如果当前文件夹没有该文件,说明下载过程遇到问题,报错并退出。
			print(file_name,'does not exist! Error happens during downloading process. Exit now')
			break
		else:
			print('Finish downloading the file.')
	except:
		continue

第一个文件40多Mb, 下载时间会偏长。


参考:

  1. Tinymind 十大网课推荐
  2. 能推荐国外大学适合自学的CS课程
  3. 斯坦福课程安排;
  4. [高级操作系统课程] 各大名校 ppt,pdf 课件整理(course materials)

更多推荐