|
|
1.1.1、黄聪:搜索引擎的工作原理-基础要求7 |/ H5 C/ o7 O- i0 G }" q
1.1.2、黄聪:搜索引擎工作原理-网页搜索基础简介# a1 u B2 j) _) \& R: ?% X5 R
1.1.3、黄聪:搜索引擎工作原理-预处理基础简介
; t8 g9 O" R6 x4 e1.1.4、黄聪:搜索引擎工作原理-查询服务基础简介
& W; C6 M, {. `& L3 Z5 Q0 j1.1.5、黄聪:搜索引擎工作原理-体系结构& r# q. m! x( i% z* V6 ]5 D: Q
2.1、黄聪:页面搜集原理、技术和系统-基础知识
+ u+ D2 B; }" {: F6 i' D: X2.2、黄聪:页面搜集原理、技术和系统-搜集过程
0 R0 n2 m3 Q# r) S2.3、黄聪:页面搜集原理、技术和系统-天网存储结构定义
; g/ J& P: w- m2.4、黄聪:页面搜集原理、技术和系统-如何避免网页重复搜集
9 X- V; \' g) |4 k2.5、黄聪:页面搜集原理、技术和系统-如何首先搜集重要的网页- k- d* T( k7 E% `( k; m8 C$ L: M( M
2.6、黄聪:页面搜集原理、技术和系统-可扩展搜索子系统
' N+ {: S. t; ]; J* k# v1 f2.6.1、黄聪:可扩展搜索子系统-节点间URL的划分策略
3 ~- R9 x5 Z" Q2 G2.6.2、黄聪:可扩展搜索子系统-系统的动态可配置性设计
2 L; o' y! p. P5 {3.1、黄聪:搜集信息的预处理-系统结构
5 _0 X5 Q) u- J) Y4 b4 N3.1.1、黄聪:搜集信息的预处理-索引网页库
I" U- J' m( E- k( C3 f0 |0 A3.1.2、黄聪:搜集信息的预处理-中文分词技术- l9 u# g1 o" Z" l
3.1.3、黄聪:搜集信息的预处理-分析页面和建立倒排文件9 N) @- `2 t, ]4 ^* J3 _$ Q7 n
3.2、黄聪:搜集信息的预处理-网页净化和消重3 {! Q: U! s/ w8 [& ^; U+ C
3.2.1、黄聪:搜集信息的预处理-净化与数据提取7 a l1 D5 ?. _9 n) U: z
3.2.2、黄聪:搜集信息的预处理-网页消重; h" B# c x8 V9 K* G/ I
4.1、黄聪:搜集引擎信息查询服务-网页信息检索
( L. s. V4 d- a! w* h' Q4.2、黄聪:搜集引擎信息查询服务-中文自动摘要, X* r( H4 O7 h- d# J4 O" S, G' b
4.3、黄聪:搜集引擎信息查询服务-生成搜索结果页
; C$ S1 B- t$ i% ]4.4、黄聪:搜集引擎信息查询服务-搜索结果页缓存
& @. M; S; m0 e' z* M" T2 m5.1、黄聪:用户行为分析-用户查询与点击日志, Z6 F6 j5 p; x v
5.2、黄聪:用户行为分析-查询日志分析
& k) E G5 R2 {) u6 ?, S+ H5.3、黄聪:用户行为分析-点击日志分析
0 e% l8 n: K" V8 S; V8 _5 d4 _6.1、黄聪:相关排序-网页权重的计算
1 T) g. {$ [1 n6.2、黄聪:相关排序-网页词项权重的计算
) m) Y+ @* {- H+ Q! m$ b, g6.3、黄聪:相关排序-链接权值的计算: x9 N" [3 H% L& p6 a- E
6.4、黄聪:相关排序-用户评价权值的计算 L' I9 m C! {4 O& h. z
6.5、黄聪:相关排序-最终权值的计算% v. l( E5 P6 j( Z$ B# @
7、黄聪:中文网页自动分类技术
7 _) Y7 x9 g# P9 }) j8 g/ K8、黄聪:搜索引擎工作原理总结 J9 }) G b) `3 s% O+ w
附1、黄聪:如何在WIN7下使用Virtualbox安装Ubuntu
! o; U# y1 l O" k) Z: ~% z附2、黄聪:如何搭建TSE搜索引擎$ _, F1 [( k1 I! O/ X
附3、黄聪:如何让TSE搜索引擎重新抓取网页% p* ^; _7 @- a8 R- k& n) b1 l9 `
5 u# _- g8 u: ~! I, j2 v& u# p5 h$ O
下载地址:https://pan.baidu.com/s/1gPW1h- I7 t3 e( d+ r- |* h7 _; } h9 C0 W
|
|