0%

本篇文章会按照以下思路来对mysql查询的原理进行讲解,首先讲解mysql是如何在单表上执行查询,在此基础上,讲解多表查询的原理,也就是join时,mysql是如何执行查询的,最后讲解mysql是如何计算查询的成本。

阅读全文 »

之前对索引这块有所了解,也按照一些索引优化实践对表进行过优化,但都是一知半解,不清楚为什么要这么做。本篇文章会对Innodb索引是怎么存储以及怎么使用的进行深入的研究,从而理解索引优化的原理,最后会对索引的使用进行总结。

索引存储结构

先来看下Innodb是如何存储数据。
主键索引

从上图可以看出,最下层存储的是相关的记录,上面一层存储的是目录项,其实就是主键索引。目录项存储格式和存储真实记录的格式一样,具体的行格式可以参考InnoDB行格式,只不过是存储的内容不一样,目录项存储的内容是主键值和其对应的页号。

通过目录项就可以根据主键id快速找到对应的记录,具体的查找过程如下

  1. 确定存储主键id对应的目录页
  2. 通过存储目录项记录的页确定用户记录真正所在的页
  3. 在真正存储用户记录的页中定位到具体的记录

另外在Innodb中,每个数据页的大小是16KB,上面存储目录的页和存储数据的页都叫做数据页,因此每页能存储的目录项是确定的,当超出大小时,就会产生一个新的目录页来存储对应的目录。最终会产生出下面这种样式的存储结构,类似于多级目录,大的目录页里嵌套小的目录页。存储数据的页当超出能存储的最大数据记录个数时,也会创建一个新的页面存储,但是只会在最下面一层。

上面描述的结构其实就是B+树。具体什么是B+树介绍的文章比较多,这里就不在具体阐述,只需要明白Innodb是如何存储数据的即可。

下面介绍几个概念

  1. 聚簇索引: 数据和索引存储在一块,上面描述的主键索引就是聚簇索引。
  2. 二级索引: 非主键索引以外的索引都可以叫做二级索引,这种索引和主键索引存储结构是一样,只是记录的数据有区别,在目录项中记录的是二级索引对应的列、主键以及页地址,数据记录中记录的是列值和主键值。因此当使用二级索引查找数据时,仅仅只是找到了对应的主键值,还需要根据主键值在主键索引中查找对应的数据,级回表操作。
  3. 联合索引: 多列组合在一起的索引,也属于二级索引,区别是存储多个列。

索引优缺点

索引的优点当然是能够加速查找,缺点有俩点,空间: 创建一个新的索引,就会将对应的结构存储到磁盘上,会增加存储的代价。时间: 虽然索引能够增加查询的速度,但是对于增删改操作时,不仅需要完成操作本身,还需要操作对应的索引,因此会增加相应的时间成本。

应用索引

参考

  1. Mysql是怎样运行的

Innodb 索引结构是怎样的
使用索引带来的问题

最近在研究网络相关内容,看到虚拟IP相关的内容,之前对这块有一些了解,但都是比较片面的认知,于是花了几天的时间,整理了相关的内容,本篇文章也是对自己整理内容的总结。

什么是虚拟ip

按照维基百科上面的介绍,虚拟IP(Vrtual IP Address,vip)是一种不与特定计算机或者特定计算机网卡相对应的IP地址。所有发往这个IP地址的数据包最后都会经过真实的网卡到达目的主机的目的进程。主要是用来网络地址转换,网络容错和可移动性。

这种定义确实准确的定义了什么是虚拟IP,不过看完之后还是摸不着头脑。下面通过一个例子来介绍VIP。

阅读全文 »

InnoDB是mysql数据库中最常用的存储引擎,对其底层进行研究有助于理解常见的一些数据库优化思路。本篇文章介绍一条记录是如何存储在磁盘上。

我们平时都是以记录为单位向表中插入数据的,这些记录在磁盘上的存放形式也被称为行格式或者记录格式。InnoDB存储引擎到现在为止设计了4种不同类型的行格式,
分别是COMPACT、REDUNDANT、DYNAMI、COMPRESSED。其中REDUNDANT是最早使用的数据格式,现在基本上不怎么使用。目前使用较多的是其它三种格式,这三种格式基本相似,只在处理变长字段上有不同。下文将首先介绍COMPACT格式,然后在以此对比来说明另外俩种格式。

阅读全文 »

在一些业务场景中,对于数据的强一致性并不是严格要求。比如用户购买商品时增加用户的积分,对于用户来说,重要的是下单成功,至于增加积分相对不是非常重要,在一段时间内保证用户的积分增加成功即可。对于这类场景,可以使用最终一致性的方案,带来的好处是可以增加应用的可用性以及qps。

本文介绍实现最终一致性的俩种方案,本地事务表和事务消息,俩种方案的核心思想都是将一个大事务拆分长一系列的小事务,通过重试机制保证一致性。

阅读全文 »

本文翻译自Base: An Acid Alternative

在分区数据库中,用一致性换取可用性可以显著提高可伸缩性。

Web应用程序在过去十年中越来越流行。无论您是为终端用户还是为应用程序开发人员(服务)构建应用程序,您最希望的是您的应用程序将获得广泛采用,并且随着广泛采用,将带来事务性增长。如果应用程序依赖持久性,那么数据存储可能会成为瓶颈。

有两种策略可以扩展任何应用程序。第一个,也是迄今为止最简单的,是垂直扩展:将应用程序移动到更大的计算机上。垂直缩放对数据的效果相当好,但有几个限制。最明显的限制是超出了最大系统的容量。垂直扩展也很昂贵,因为增加事务处理能力通常需要购买下一个更大的系统。垂直扩展通常会造成供应商锁定,进一步增加成本。

水平缩放提供了更大的灵活性,但也相当复杂。水平数据缩放可以沿两个方向执行。功能扩展涉及按功能对数据进行分组,并将功能组分布在数据库中。将功能区域内的数据跨多个数据库拆分,或进行切分,即第二种策略。下图解释了水平数据缩放策略。

阅读全文 »

日常在写单元测试过程中,如何构造合适的测试数据是比较麻烦并且乏味的。本篇将介绍俩个工具用于生成测试数据,首先介绍Datafaker,此工具用于生成各种常见的测试数据。接着介绍easy-random,用于生成测试对象。最后介绍如何结合这俩个工具生成比较真实的测试对象。

阅读全文 »

本篇文章主要用来记录研究aop源码的过程。

aop 基本概念

  • 方面(Aspect):跨越多个类的模块化关注点。事务管理是企业Java应用程序中横切关注点的一个很好的例子。在SpringAOP中,方面是通过使用常规类(基于xml的方法)或使用@Aspect注解(@Aspectj样式)注解的常规类来实现的。
  • 连接点(Join point):程序执行过程中的一点,如方法的执行或异常的处理。在SpringAOP中,连接点总是表示一个方法执行。
  • 通知(Advice):一个方面在特定连接点采取的行动。不同类型的通知包括“环绕”、“前“和”后”通知。(稍后将讨论通知类型。)许多AOP框架(包括Spring)将通知建模为拦截器,并在连接点周围维护拦截器链。
  • 切点(Pointcut):与连接点匹配的谓词。通知与切入点表达式关联,并在与切入点匹配的任何连接点上运行(例如,使用特定名称执行方法)。pointcut表达式匹配的连接点概念是AOP的核心,Spring默认使用AspectJ pointcut表达式语言。
  • 引入(Introduction):代表类型声明其他方法或字段。SpringAOP允许你向任何advised对象引入新的接口(和相应的实现)。例如,你可以使用一个Introduction使bean实现一个IsModified接口,以简化缓存。(introduction在AspectJ社区中称为类型间声明。)
  • 目标对象(Target object):由一个或多个方面advised的对象。也称为“advised 对象”。因为SpringAOP是通过使用运行时代理实现的,所以这个对象始终是一个代理对象。
  • AOP代理:由AOP框架创建的用于实现aspect contracts(通知方法执行等)的对象。在Spring框架中,AOP代理是JDK动态代理或CGLIB代理。
  • 编织(Weaving):将aspects与其他应用程序类型或对象链接,以创建advised的对象。这可以在编译时(例如,使用AspectJ编译器)、加载时或运行时完成。Spring AOP和其他纯Java AOP框架一样,在运行时进行编织。

Spring AOP包含以下几种通知类型:

  • Before advice:在连接点之前运行但不能阻止执行到连接点的通知(除非它抛出异常)。
  • After returning advice:在连接点正常完成后要运行的通知(例如,如果方法返回并且不引发异常)。
  • After throwing advice: 如果方法通过引发异常而退出,则要执行的通知。
  • After (finally) advice:无论连接点退出的方式如何(正常或异常返回),都要执行的通知。
  • Around advice:环绕连接点(如方法调用)的通知。这是最有力的通知。around通知可以在方法调用前后执行自定义行为。它还负责通过返回自己的返回值或引发异常来选择是继续到连接点还是快捷地执行通知的方法。
阅读全文 »