按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
的备份是额外的负荷
315
…………………………………………………………Page 316……………………………………………………………
SQL 21 日自学通(V1。0) 翻译人 笨猪
OLAP 的调试
如果要调试 OLAP 系统 例如数据仓库或决定支持的系统 与调试 OLTP 系统有着相
当大的不同 一般说来 它需要较大的空间用以进行分类
由于这种系统的目的是获得有用的用以决策的数据 所以你可以想象得到它有着相当
多的复合查询并且通常要涉及到对数据的分组和排序 与事务处理数据库相比较而言
OLAP 系统是将较多的空间用于对数据的分类和排序而把较少的空间用于撤消区域的代
表
在 OLAP 系统中的大多数事务是作为批处理进程中的一部分存在的 代之以为用户输
入提供大量的输入撤消区域 你会采用一个很大的撤消区域用以加载 这样可以实现离线
工作以减少工作负荷
批量载入与事务处理进程
对于 SQL 语句和数据库而言的一个重要的性能因素是处理的类型和它在数据库中所占
用的空间 一种处理类型为 OLTP 它已经在今天的早些时候讨论过了 当我们谈到事务
处理过程时 我们是指两种输入方法 用户输入和批量载入
正常情况下用户的输入是由 INSERT UPDATE DELETE 语句组成的 这种类型的事
务其性能通常是依据最终用户或客户而定的 最终用户通常使用前端应用程序如
PowerBuilder 来与数据库进行交互 所以他们很少能够看到 SQL 语句 然而 SQL 代码仍
然通过他们所使用的前端应用程序产生了
当我们优化数据库的性能时我们的重点应该在最终用户的事务上 毕竟 没有用户
就是 没有数据库 你也将会失业 你一定要力争让你的用户感到高兴 即使他们对数据
库或系统的期望有些时侯是不合情理的 对最终用户需要考虑的是最终用户输入的并发数
量 在你的数据库中用户并发操作越多 数据库性能下降的可能性就越大
什么是批量载入呢 批量载入就是在一次事务中完成对数据库所进行的任务 例如
如果你想把上一年的记录存入一个很大的历史表中 你需要在你的历史表中插入成千上万
条的记录 你大概不想手工来完成这个工作 所以你会创建一个批任务或是一个脚本来自
动完成这个工作 对于批量装入数据是有很多的技术可以使用的 批量载入由于它对系统
资源和数据库资源占用而名声不好 这些数据库资源包括表的访问 系统目录的访问 数
316
…………………………………………………………Page 317……………………………………………………………
SQL 21 日自学通(V1。0) 翻译人 笨猪
据库回退 和排序空间 系统资源则包括 CPU 和共享内存的占用 根据你所使用的操作系
统和数据库服务 可能还有许多麻烦的工作
最终用户事务与批量载入对于大多数数据库来说是成功的必备 但是当这两种类型的
过程死锁时你的数据库系统会面临严重的性能考验 所以你应该知道它们之间的不同 如
果可能最好对它们进行隔离 例如 当最终用户活动处于高峰时你不应该向数据库中装入
大量的的数据 数据库的响应会因为并发用户的增多而变慢 你要在最终用户访问最少的
时候执行批量载入任务 许多公司都选择在夜间或是早上执行批量载入任务以避免与日间
的进程产生冲突
对于大量的批量载入你一定要安排好时间 要认真的避开数据库可能进行常规用户访
问的时间 下表给出的当重载批处理任务进行时又有多个用户进行访问所引出资源引用冲
突的情况
正如你所看到的 许多进程在争用的系统的资源 重载的批处理任务已经打破了这种
平等的情况 系统将不能为每一个用户平均地分配资源 批处理任务已经大量地占用了它
们 这种情况只是资源争夺的开始 如果批处理任务进行下去 用户的进程可能会在最后
被迫退出这副图 这在生意上是非常不利的 即使系统中只有一个用户 这种竞争也还是
会出现
使用批处理进程的另外一个问题是当另一个用户访问它所访问的表时可能会死锁 如
果一个表被锁住了 用户将会被拒绝访问直到批处理进程解除对该表的锁定 这可能会是
几个小时的时间 如果可能 批处理进程应该是系统处理最佳的时候发生 不要让用户与
批处理进程进行竞赛 没有人会在这样的比赛中获胜
317
…………………………………………………………Page 318……………………………………………………………
SQL 21 日自学通(V1。0) 翻译人 笨猪
删除索引以优化数据的载入
一种可以加快批量更新速度的方法是删除索引 设想一下如果历史表的记录有上千条
而且它还可能有一个甚至更多的索引 你认为索引会怎样 你通常会认为索引可以加快表
的访问速度 但是在批量载入的时候 将索引删除的好处可能会更大
当你通过索引向表中装放数据的时候 你通常会希望尽可能地使用索引 尤其是当你
要更新的记录在表中所占的比率很高的时候 那么让我们来看一下这种方法 如果我们学
习一本以后续指引的书的话 你也许会发现从头至尾地看这本书要比用索引来定位你的关
注点更快 如果你所要关注的东西所占的比重占全书中的比重比较小的时候索引是更有效
的
为了让数据占总表比重相当的批量载入达到最大效率 你可以使用下边的三步来使索
引失去作用
1 删除适当的索引
2 装入或更新表中的数据
3 重新生成表的索引
经常使用 MIT 来让 DBA 走开
当你在执行一个批量事务时 你必须知道要多长时间执行一回 MIT 命令 就像
你在第 11 天 事务控制 所学到的那样 MIT 可以结束一个事务 MIT 可以将
事务中所作的任何改变写要实际的表中 但是在后台 它做的工作不只如此 在数据库中
有一个区域是用以存储全部的写到实际表中之前的事务数据的 ORACLE 将这一区域叫做
ROLLBACK 段 当你执行一个 MIT 命令以后 与你的 SQL 相关联的事务会将
ROLLBACK 段中的内容写到实际的表中 然后更新这一区域 ROLLBAKC 段中的原有内
容就被删除了 ROLLBACK 命令是另一种清除 ROLLBACK 段的命令方法 只是它不将所
做的改动写到目标表中
如你所料 如果你一直不执行 MIT 或 ROLLBACK 命令 那么事务就会一直保存
在 ROLLBACK 段中 随之而来的是 如果你要装入的数据大小比 ROLLBACK 段的可用
空间还要大 数据库将会终止并挂起所有的活动事务 不运行 MIT 命令是通用程序
的一个缺陷 有规律地使用 MIT 命令将会例数据库系统输入的性能稳定
318
…………………………………………………………Page 319……………………………………………………………
SQL 21 日自学通(V1。0) 翻译人 笨猪
对 ROLLBACK 的管理是数据库管理员 DBA 的一项复杂而重要的责任 因为事务
对 ROLLBACK 段的影响是动态的 随后是像个别的 SQL 语句一样影响数据库的整体性能
所以当你批量载入大量数据的时候 要确保按一定的规律执行 MIT 命令 由你的数
据库管理进行检查并告诉你应该很久执行一次 MIT 命令 见下图
你在上图中也看到了 当用户执行一个事务的时候 所做的改动是保存在 ROLLBACK
段中的
在动态环境中重新生成表和索引
在大型数据库系统中动态数据库环境一词的意思就是状态在不断地改变 我们在批处
理进程和日常事务处理过程中会经常使用这种改变 动态数据库通常很定于 OLTP 系统
但是也可以在 DSS 或数据仓库中引用它 这要视需载入的数据的量和频度而定
结果是数据库中持续不断的大量数据的改变 从而造成大量的碎片 如果管理不当这
些碎片就很容易失去控制 ORACLE 在表最初生成时为它分配了一个长度 当数据载入并
填充完初始长度以后 初创建的表会得到下一个分配的长度
表和索引的大小的数据库管理员的工作 而且它对 SQL 语句性能的影响是很大的 首
先要进行正确的管理 所分配的空间应该足够表在一天中所增加的尺寸 同时也应该制定
一个计划以按一定的规律对数据库进行碎片的清理工作 如果可能最好这成为每周的例行
工作 清除关系型数据库中的表和索引的碎片在基本概念上的非常麻烦的
1 对表和索引进行完善的备份
2 删除表和索引
3 用新的分配空间来重新生成表和索引
319
…………………………………………………………Page 320……………………………………………………………
SQL 21 日自学通(V1。0) 翻译人 笨猪
4 将数据恢复到新建的表中
5 如有必须 重新生成索引
6 对该表重新分派用户的规则和权限
7 直到你已经确认了新生成的表是完全正常的 否则请保留备份 如果你选择了放弃
对原始表的备份 你要在新表的数据完全恢复后马上做一个备份
警告 当你还没有确认新表已经完全正常之前