python如何定义索引模块类

993次阅读
没有评论

python如何定义索引模块类

python定义索引模块类说明

1、索引模型的主要作用是构建倒排索引,这是搜索引擎的关键环节。

构建索引的目的是提高查询速度。

2、索引一般都是通过文章标识来索引文章内容,而倒排索引正好相反,通过文章内容来索引文章标识。

具体而言,倒排索引将以文章中出现的单词为键,并以单词所在的文章标记为值构建索引。

python定义索引模块类实例

构建并保存好索引 iindex,数据以 JSON 形式存储,保存在 json 文件。

{
    word: {
        'df': document_frequency,
        'ds': [{
            'id': document_id,
            'dl': document_length,
            'tf': term_frequency
        }, ...]
    },
    ...
}
神龙|纯净稳定代理IP免费测试>>>>>>>>天启|企业级代理IP免费测试>>>>>>>>IPIPGO|全球住宅代理IP免费测试

相关文章:

版权声明:wuyou2022-03-15发表,共计385字。
新手QQ群:570568346,欢迎进群讨论 Python51学习