2018.11.28更新: FunpySpiderSearchEngine-ElasticSearch or Mysql 搜索引擎

Scrapy1.5.1(爬取数据) + ElasticSearch6.3.2(存储数据并提供对外Restful Api) + Django 打造搜索引擎网站 (可配置数据存入Mysql)

线上演示地址: http://search.mtianyan.cn

运行在旧笔记本版冒充服务器上使用frp内网穿透，不定时开启，如有强烈体验愿望, QQ: 1147727180

本仓库为爬虫端数据入库ElasticSearch代码,实现整个搜索需要结合Django网站端项目 https://github.com/mtianyan/mtianyanSearch

可用功能:

伯乐在线，拉勾职位，知乎爬虫存入Mysql & 存入ElasticSearch
全文搜索(需结合网站端一起使用)，搜索建议，我的搜索记录，搜索词高亮标红，搜索结果底部分页
Redis实现的实时三站已爬取数目展示，热门搜索Top-5

项目外部依赖

ElasticSearch6.3.2 + ElasticSearch-analysis-ik(中文分词) + Redis + Mysql

长期维护更新

定期对伯乐在线博客文章，拉勾网职位，知乎的问题回答爬取进行了维护更新，并进行了存入Mysql 以及存入ElasticSearch6的测试。

如何开始使用？

安装ElasticSearch6.3.2,配置ElasticSearch-analysis-ik插件,安装Redis(可选配置ElasticSearch-head)

git clone https://github.com/mtianyan/FunpySpiderSearchEngine
# 新建数据库mtian_search; Navicat导入mysql文件; 修改config_template配置信息,去除_template后缀。
# 执行 sites/es_* 配置ELasticPipeline

cd FunpySpiderSearchEngine
pip install -r requirements.txt
scrapy crawl zhihu
scrapy crawl lagou
scrapy crawl jobbole

TODO:

扩展更多网站(此处承接爬虫+搜索项目:小可到毕设);网站端自适应移动;Mysql持久化数据结合Django管理

致谢原版视频课程地址:

感谢Bobby老师的这门课程，通过这门课程学到了很多很多，自己在踩坑填坑，持续更新版本，时效更新，解决的时候，收获的不只有知识，我觉得更多是解决问题的能力。

简书相关文集地址(已过期，只有一定参考意义，最好的读物是源码!):https://www.jianshu.com/nb/11202633

关于我

一个学过php，做过安卓，摸过渗透，看过点前端，会写一点Python，最后发现自己啥也不会的肥宅在哭泣，欢迎加入有趣的Python群：619417153

简书

欢迎关注简书，star项目！谢谢！你的关注支持是我继续分享前进的动力

求打赏鼓励

很高兴我写的文章（或我的项目代码）对你有帮助，请我吃包辣条吧!

微信打赏:

支付宝打赏:

Name		Name	Last commit message	Last commit date
Latest commit History 26 Commits
FunpySpiderSearch		FunpySpiderSearch
.gitignore		.gitignore
LICENSE		LICENSE
Pipfile		Pipfile
Pipfile.lock		Pipfile.lock
README.md		README.md
config_template.py		config_template.py
main.py		main.py
requirements.txt		requirements.txt
scrapy.cfg		scrapy.cfg
search.sql		search.sql

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

2018.11.28更新: FunpySpiderSearchEngine-ElasticSearch or Mysql 搜索引擎

可用功能:

项目外部依赖

长期维护更新

如何开始使用？

TODO:

致谢原版视频课程地址:

关于我

求打赏鼓励

About

Releases

Packages

Languages

License

huning2009/FunpySpiderSearchEngine

Folders and files

Latest commit

History

Repository files navigation

2018.11.28更新: FunpySpiderSearchEngine-ElasticSearch or Mysql 搜索引擎

可用功能:

项目外部依赖

长期维护更新

如何开始使用？

TODO:

致谢 原版视频课程地址:

关于我

求打赏鼓励

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

致谢原版视频课程地址:

Packages