article20201122

Posted on 2021-06-13 Edited on 2021-06-14

大数据 | 大数据基础--算法之外村模型算法：外存模型

亲爱的读者朋友大家晚上好，前几次我们简单介绍了并行模型算法，这次我们来介绍外村模型以及相应的一些算法。

到目前为止，按照存储模型，我们学过的算法模型应该分为两种：一种是\(RAM\)模型，也就是我们常用的算法的设计模型，另一种是\(I/O\)模型，内存比数据量小，外存是无限的。

外存访问与内存访问有一些差异：

在\(I/O\)模型中，内存的大小为\(M\)，页面大小为\(B\)，外存大小无限，页面大小为\(B\)。

在\(I/O\)模型中，内存的大小为\(M\)，页面大小为\(B\)，外存大小无限，页面大小为\(B\)。

连续读取外存上的\(N\)个数据，需要多少次\(I/O\)？

\(O(N/B)\)

如何计算矩阵乘法？

输入两个大小为\(N\times N\)的矩阵\(X\)和\(Y\)

链表

进行三种操作：\(insert(x,p),remove(p),traverse(p,k)\)

内存模型下各个操作的时间复杂度：\(update O(1),traverse O(k)\)

在外存模型下，将一个链表中连续的元素放在一个大小为\(B\)的块中。同时，令每个块大小至少为\(B/2\)：

搜索结构

进行三种操作：\(insert(x),remove(x),query(x)\)

\((a,b)-tree:2\leq a \leq (b+1)/2\)

类似二分查找树\(\Rightarrow (p_0,k_1,...,k_c,p_c)\)

\(root\)节点有0个或者\(\geq 2\)个孩子；除了\(root\)，每个非叶子节点的孩子数目\(\in [a,b]\)：

以上就是关于外存模型的简单介绍以及一些基本的基于外村模型的数据结构和简单问题解决方案。下次我们会对外存排序问题进行分析，敬请期待~