TF-IDF 简介
简介 TF-IDF(Term Frequency-Inverse Document Frequency)是一种在信息检索和文本挖掘中广泛使用的统计方法,用于评估一个词在一个文档中的重要性。它结合了两个关键概念:词频(Term Frequency, TF)和逆文档频率(Inverse Document Frequency, IDF)。 词频 (Term Frequency, TF) 定义:词频是指某个词在文档中出现的次数。为了防止文档长度对结果的影响,通常会将词频进行归一...
Python Scrapy 爬虫框架
Scrapy 相关细节 安装scrapy框架 pip install scrapy -i https://pypi.douban.com/simple 创建scrapy爬虫 进入项目文件夹 cd project_name/project_name/spiders 运行命令 scrapy startproject project_name url D:\Practice\Python\Scrapy_20230226\scrapy_carhome\scrapy_carhome\spiders> scrapy genspider car https://car.autohome...
Python 环境问题
Pycharm Anaconda Conda 创建Conda虚拟环境 指定python版本和环境名称 conda create -n env_name python=3.8 指定python版本, 环境名称, 环境安装路径 conda create --prefix=C:/ProgramData/Anaconda3/envs/ENV_spider python=3.9 激活所安装的环境 conda activate env_name 在当前激活的环境里安装包 conda install package_name ...
Django Rest Framework
Web应用开发模式 前后端分离 通俗地讲, 其实判定很简单:如果前端和后端这两个角色, 只通过API 文档就能进行数据交流,就说明他们的逻辑是分离的。我们可以称之为 “前后端代码分离”。 如果除了 API 文档之外还需要各种其他的数据交流方式,比如后端把数据藏在一个 div 的属性里,那么就不是前后端分离的。像各种框架里的模板引擎和渲染功能。 至于所谓的 “最佳实践”...
Python 进程, 线程, 协程
什么是进程? 进程是对资源进行分配和调度的最小单位,是操作系统结构的基础,是线程的容器(就像是一幢房子,一个空壳子,并不能运动)。 进程是一个实体,每个进程都有自己的地址空间,一般包括文本区域(text region)、数据区域(data region)和堆栈(stack region) 文本区域存储处理器执行的代码;数据区域存储变量和进程在执行期间所使用的动态分配的内存;堆栈区域存...
Python 进程/线程/协程/异步编程
前置基础 什么是GIL? 进程 线程 协程 非协程实例 首先来看非协程的代码实例 t1 = time.time() def func1(): print("当前执行function 1") time.sleep(1) # 当程序出现了同步操作的时候. 异步就中断了 print("当前执行function 1") def func2(): print("当前执行function 2") time.sleep(2) print("当前执行function 2") ...
What does if __name__ == “__main__”: do?
a = 'a' print('我是script a') print(a) import script_a b = 'b' print('我是script b') print(b) a = 'a' print('我是script a') if __name__ == "main": print(a) import script_a b = 'b' print('我是script b') print(b) 现在有A.py和 B.py两个脚本文件 A.py B.py 在B中import A import A这...
Django – 前端提交数据, 后端接收并入库简例 (ModelForm)
models.py class Boss(models.Model): name = models.CharField(verbose_name="姓名", max_length=64) age = models.IntegerField(verbose_name="年龄") img = models.CharField(verbose_name="头像", max_length=256) 这种写法需要在view_name.py文件中去处处理 待保存文件的路径问题, 并调用create方法. media_file_path = os.path.join("media...
Django – 前端提交数据, 后端接收并入库简例 (Form)
view class UpForm(BootStrapForm): 封装了bootstrap的Form组件的类, 让表单快速获得bootstrap的样式 bootstrap_exclude_fields = ['img'] # 在BootStrapForm中,排除img表单的样式 name = forms.CharField(label="姓名") age = forms.IntegerField(label="年龄") img = forms.FileField(label="头像") def upload_form(request): title = "表格上传"...
Django – Form和ModelForm组件
表单的很多字段信息, 和models.py文件里的模型是一致的,为了避免重复代码,以及提高效率, 可以使用ModelForm,将模型和表单进行绑定。 Form views.py //创建业务类MyForm, 继承django中Form类 class MyForm(Form): // Form类会在html中渲染出原始表单 user = forms.CharField(widget=forms.Input) pwd = form.CharFiled(widget=forms.Input) email = form....
Python 面向对象
简介 对具象化的事物进行抽象, 尽管细节有偏差, 但与其他大部分编程语言的面向对象概念类似. 一个极简实例 class Animal(object): def __init__(self, name, color): self.name = name self.color = color def describe(self): # return self.name + self.score print(f'名字:{self.name} | 颜色:{ self.color}') # 注意到...