SEO初学者-搜索引擎如何工作

  1. 搜索引擎基础
  2. 搜索引擎是如何建立索引的
  3. 搜索引擎如何对网页进行排名
  4. 搜索引擎是如何个性化搜索结果的

 搜索引擎的工作方式是使用网络爬虫抓取数十亿个页面。爬虫也称为蜘蛛或机器人,它们在网络上导航并跟踪链接以查找新页面。然后,这些页面会被添加到搜索引擎从中提取结果的索引中。

 

什么是搜索引擎?

搜索引擎是可搜索的网络内容数据库。它们由两个主要部分组成: 

  1. 搜索索引。有关网页的信息的数字图书馆。 
  2. 搜索算法。负责匹配搜索索引结果的计算机程序。

搜索引擎的目的是什么?

每个搜索引擎都致力于为用户提供最佳、最相关的结果。这也是他们赢得市场份额的方式之一。

搜索引擎如何赚钱?

搜索引擎有两种类型的搜索结果: 

  1. 来自搜索索引的自然结果。您无需付费即可访问此处。
  2. 来自广告商的付费结果。您可以付费来到这里。

每次有人点击付费搜索结果时,广告商都会向搜索引擎付费。这就是所谓的按点击付费 (PPC) 广告,这就是市场份额如此重要的原因。用户越多,广告点击次数越多,收入也就越多。

每个搜索引擎都有自己的搜索索引构建流程。以下是 Google 使用的流程的简化版本.

让我们分解一下。

网址

一切都始于已知的 URL 列表。Google 会通过多种方式发现这些 URL,但最常见的三种方式是: 

  • 通过反向链接。谷歌拥有数千亿个网页的索引。如果有人从已知页面链接到新页面,谷歌就可以从那里找到它。
  • 来自站点地图。站点地图会告诉 Google 你认为网站上哪些页面和文件比较重要。
  • 通过 URL 提交。Google允许网站所有者在Google Search Console中请求抓取单个 URL 。

爬行

抓取是指计算机机器人(称为蜘蛛)访问并下载已知 URL 的过程。Google 的抓取工具是Googlebot

处理和渲染

处理是指 Google 理解和提取抓取到的网页中的关键信息。为此,它必须呈现网页,也就是运行网页代码以了解网页在用户眼中是什么样子。 

除了 Google 之外,没有人知道这个过程的所有细节。但这并不重要。我们真正需要知道的是,它涉及提取链接和存储内容以供索引。 

索引

索引是将抓取的页面中处理过的信息添加到搜索索引中。

搜索索引就是您使用搜索引擎时搜索的内容。这就是为什么在 Google 和 Bing 等主要搜索引擎中建立索引如此重要。除非您在索引中,否则用户无法找到您。 

你可知道?

Google 占据了 91.43% 的搜索引擎市场。它可以比其他搜索引擎带来更多流量,因为它是大多数人使用的搜索引擎。

发现、抓取和索引内容只是难题的第一部分。搜索引擎还需要一种方法来在用户执行搜索时对匹配结果进行排名。这是搜索算法的工作。

什么是搜索算法?

搜索算法是从索引中匹配和排列相关结果的公式。Google 在其算法中使用了许多因素。

谷歌排名的关键因素

没有人知道所有的 Google 排名因素,因为 Google 并未公布这些因素。但我们确实知道一些关键因素。让我们来看看其中的几个。

反向链接

反向链接是从一个网站的页面链接到另一个网站的链接。它们是 Google 最重要的排名因素之一。这可能就是为什么我们在对超过十亿个页面的研究中发现链接域和自然流量之间存在很强的相关性的原因。

不过,数量并不重要。质量也很重要。拥有的少量高质量反向链接页面通常比拥有大量低质量反向链接的页面排名更高。

关联

相关性是指搜索结果对搜索者的实用性。Google 有很多方法可以确定相关性。最基本的方法是查找包含与搜索查询相同的关键词的页面。它还会查看互动数据,看看其他人是否认为该结果有用。

新鲜

新鲜度是与查询相关的排名因素。对于需要新鲜结果的搜索,新鲜度更重要。这就是为什么你会看到“new Netflix series”的热门结果,而不是“how to resolve a rubik's cube”的原因。 

页面速度

网页速度是桌面和移动设备上的排名因素。但它对排名的影响更多的是负面的,而不是正面的。这是因为它对最慢的页面产生负面影响,而不是对速度极快的页面产生正面影响。

移动友好性

自2019 年谷歌转向移动优先索引以来,移动友好性一直是移动设备和桌面设备上的排名因素。

Google 会根据每位用户的情况定制搜索结果。它使用用户的位置、语言和搜索历史等信息来实现这一点。让我们仔细看看这些内容。

地点

Google 会使用您的位置来个性化具有本地意图的搜索结果。这就是为什么“意大利餐厅”的所有搜索结果都来自或关于本地餐厅。Google 知道您不太可能为了吃午饭而飞越半个地球。

语言

Google 知道向西班牙用户显示英文搜索结果毫无意义。因此,它会向使用不同语言的用户排名本地化版本的内容(如果有)。

 

搜索历史

谷歌会保存你做过的事情和去过的地方,以便为你提供更加个性化的搜索体验。你可以选择不这样做,但大多数人可能不会这样做。 

关键要点

  • 搜索引擎由两个主要部分组成:索引和算法。
  • 为了建立索引,它会抓取已知页面并跟踪链接来查找新页面。 
  • 搜索算法的目的是返回最佳、最相关的结果。
  • 搜索结果质量对于建立市场份额至关重要。
  • 没有人知道 Google 影响自然搜索结果排名的所有因素。
  • 关键排名因素包括反向链接、相关性和新鲜度。 
  • Google 会根据您的位置、语言和搜索历史记录来个性化其搜索结果。 

参考

  1. “了解 JavaScript SEO 基础知识”。谷歌。2022 年 8 月 16 日检索。 
  2. “组织信息——谷歌搜索的工作原理”。谷歌。2022 年 8 月 16 日检索
  3. “了解站点地图”。谷歌。检索日期:2022 年 8 月 16 日
  4. “Googlebot”。谷歌。2022 年 8 月 16 日检索
  5. “全球搜索引擎市场份额”。Statcounter。2022年 8 月 16 日检索
  6. “Google Q&A+ #March”。YouTube。2022年 8 月 16检索
  7. “90.63% 的内容没有从 Google 获得流量。以及如何成为剩下的 9.37%”。Ahrefs。2020年 1 月 31 日。2022 年 8 月 16 日检索
  8. “CloudFlare Radar” 。CloudFlare。2022年8 月 16 日检索
  9. “搜索结果排名——谷歌搜索的工作原理”。谷歌。2022 年 8 月 16 日检索
  10. “在网页搜索排名中使用网站速度”。谷歌。检索日期:2022 年 8 月 16 日
  11. “在移动搜索排名中使用页面速度”。谷歌。检索日期:2022 年 8 月 16 日
  12. “移动优先索引最佳实践”。谷歌。检索日期:2022 年 8 月 16 日
  13. “查找并控制你的网络和应用活动”。谷歌。2022 年 8 月 16 日检索

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/492098.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

构建centos docker基础镜像

1、介绍 比较老的版本docker镜像,不太好找,可以尝试自己构建 各版本构建基础镜像方法不太一样,方式也不同,自己尝试,本文只介绍了我自己的尝试 2、构建centos5.11 docker镜像 准备iso文件 (1)安…

多曝光融合中无监督学习方法主导的深度思考

在计算机视觉领域,多曝光融合一直是一个备受关注的研究方向。这项技术旨在将同一场景在不同曝光条件下拍摄的多张图像合成为一张包含完整动态范围信息的图像。近年来,深度学习方法在这个领域取得了显著进展,但有一个有趣的现象值得我们深入探…

Linux脚本语言学习--上

1.shell概述 1.1 shell是什么? Shell是一个命令行解释器,他为用户提供了一个向Linux内核发送请求以便运行程序的界面系统级程序,用户可以使用Shell来启动,挂起,停止甚至是编写一些程序。 Shell还是一个功能相当强大…

活动预告|云原生创新论坛:知乎携手 AutoMQ、OceanBase、快猫星云的实践分享

近年来,云原生技术迅猛发展,成为企业数字化转型的关键动力,云原生不仅极大地提升了系统的灵活性和可扩展性,还为企业带来了前所未有的创新机遇。 12 月 28 日 知乎携手 AutoMQ、OceanBase 和快猫星云推出“云原生创新论坛”主题的…

XXE靶场

XXE-lab 靶场 靶场网址&#xff1a;http://172.16.0.87/ 第一步我们看到网站有登录框我们试着用 bp 去抓一下包 将抓到的包发到重放器中 然后我们构建palody <!DOCTYPE foo [ <!ENTITY xxe SYSTEM "php://filter/readconvert.base64-encode/resourceC:/flag/fla…

djiango DRF的使用

djiango DRF的使用 一 、初始 DRF序列化环境安装环境配置数据模型定义定义DRF序列化模型对象 二 、DRF请求和响应请求对象&#xff08;Request objects&#xff09;响应对象&#xff08;Response objects&#xff09;状态码&#xff08;Status codes&#xff09;包装&#xff0…

【BUG】记一次context canceled的报错

文章目录 案例分析gorm源码解读gin context 生命周期context什么时候cancel的什么时候context会被动cancel掉呢&#xff1f; 野生协程如何处理 案例分析 报错信息 {"L":"ERROR","T":"2024-12-17T11:11:33.0050800","file"…

Qt WORD/PDF(四)使用 QAxObject 对 Word 替换(QWidget)

关于QT Widget 其它文章请点击这里: QT Widget 国际站点 GitHub: https://github.com/chenchuhan 国内站点 Gitee : https://gitee.com/chuck_chee 姊妹篇: Qt WORD/PDF&#xff08;一&#xff09;使用 QtPdfium库实现 PDF 操作 Qt WORD/PDF&#xff08;二…

使用nvm对node进行多版本管理

1.nvm下载及安装 下载链接 下载完成后&#xff0c;对文件进行解压安装&#xff0c;按照提示一步步安装&#xff0c;如果电脑上之前有安装过node&#xff0c;需要先卸载&#xff0c;再进行安装。 按照提示完成安装。 2.设置环境变量 可以现在C:\Users\name\AppData\Roamin…

基于Socket实现客户端和服务端的Tcp通信(C#)

0.前言 使用C#和Unity实现复刻Liar’s bar中的功能 软件开发大作业 本系列文章用于记录与分享开发过程中使用到的知识点&#xff0c;以及常见错误 本文主要描述有关网络编程的内容 目录 0.前言1.使用Socket搭建Server1.1Server端的Socket连接1.2 Server端接收Client的信息1.3…

eclipse 如何设置项目、不同类型文件的 utf8 编码

编码问题一直是软件开发中让人头疼的小细节&#xff0c;尤其是团队协作中&#xff0c;若编码格式不统一&#xff0c;乱码问题便会频繁出现。那么如何在 Eclipse 中统一设置项目和文件的 UTF-8 编码&#xff0c;避免因编码问题造成不必要的困扰呢&#xff1f;今天&#xff0c;我…

MVC基础——市场管理系统(四)

文章目录 项目地址六、EF CORE6.1 配置ef core环境6.2 code first6.2.1 创建Database context1. 添加navigation property2. 添加MarketContext上下文七、Authentication7.1 添加Identity7.2 Run DB migration for Identity7.3 使用Identity7.3.1 设置认证中间件7.3.2 设置权限…

java后端环境配置

因为现在升学了&#xff0c;以前本来想毕业干java的&#xff0c;很多java的环境配置早就忘掉了&#xff08;比如mysql maven jdk idea&#xff09;&#xff0c;想写个博客记录下来&#xff0c;以后方便自己快速搭建环境 JAVA后端开发配置 环境配置jdkideamavenMySQLnavicate17…

Edge Scdn用起来怎么样?

Edge Scdn&#xff1a;提升网站安全与性能的最佳选择 在当今互联网高速发展的时代&#xff0c;各种网络攻击层出不穷&#xff0c;特别是针对网站的DDoS攻击威胁&#xff0c;几乎每个行业都可能成为目标。为了确保网站的安全性与稳定性&#xff0c;越来越多的企业开始关注Edge …

CN-fnst::CTF Web

文章目录 ezphpez_pythoncomment_mefilechecker_revengei_am_eeeeeshili ezphp 直接数组绕过, 执行命令 GET: usn[]1&usn1[]1&signenv POST: pwd[]2&pwd1[]2 ez_python file参数任意文件读取 读取源码: ?fileapp.py from flask import Flask, request, render_…

AI自我进化的新篇章:谷歌DeepMind推出苏格拉底式学习,语言游戏解锁无限潜能

各位AI爱好者、技术研究者&#xff0c;大家好&#xff01;今天我们来聊聊一个令人兴奋的AI研究新进展——谷歌DeepMind推出的“苏格拉底式学习”方法。这项研究的独特之处在于&#xff0c;它让AI在没有外部数据的情况下&#xff0c;通过“语言游戏”实现自我进化&#xff0c;这…

《类和对象:基础原理全解析(上篇)》

目录 一、浅谈面向过程和面向对象二、C 中的结构体&#xff08;struct&#xff09;1. C 中 struct 的使用 三、C 中的类&#xff08;class&#xff09;四、类的封装性1. 类成员的权限控制关键字2. 权限控制关键字的使用 五、类的六大默认成员函数介绍六、构造函数1. 使用构造函…

电子应用设计方案-59:智能电动床系统方案设计

智能电动床系统方案设计 一、引言 智能电动床作为一种高端家居产品&#xff0c;旨在为用户提供更加舒适、便捷和个性化的睡眠体验。本方案将详细介绍智能电动床系统的设计架构、功能特点和技术实现。 二、系统概述 1. 系统目标 - 实现床体的多部位电动调节&#xff0c;满足不…

电商环境下的财务ERP系统架构

先介绍一下自己的工作经历&#xff0c;2002年开始进入ERP实施行业&#xff0c;专注于O记EBS系统&#xff0c;正好赶上中国经济和信息化高度发展的阶段&#xff0c;先后实施过很多大国企和民企的大型ERP项目&#xff0c;在实施过程中逐渐对ERP系统的架构、模块设计有更深入的认识…

【WRF教程第3.2期】预处理系统 WPS详解:以4.5版本为例

预处理系统 WPS 详解&#xff1a;以4.5版本为例 WPS 嵌套域&#xff08;WPS Nested Domains&#xff09;USGS 和 MODIS 土地利用重力波拖拽方案静态数据&#xff08;Gravity Wave Drag Scheme Static Data&#xff09;1. 什么是重力波拖拽方案&#xff08;GWDO&#xff09;静态…