按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
的话题是“哪个学生要被请出学院”。那些学习成绩
不好的、研究项目毫无进展的,都有可能在“黑色 星期五”被淘汰。卡内基·梅隆大学每年培养一个 博士生的经费大约是两万美元,而一个拿不到博士 学位的人,对大学来说是一种浪费。
在卡内基·梅隆大学的 El 子里,大家每天都投 入地学习着。大家都知道,这里有许多世界一流的 教授做伴。除了我那充满激情的导师瑞迪教授,还 有一位每一门课程都能教的华人教授,他是华人中 顶尖的计算机天才,对专业的研究非常精深,不过 他有点结巴,有的时候一个音节拖了半天也说不出 来,因此上他的课,学生们总是不敢坐第一排,唯 恐 他 一 结 巴 , 就 口 水 横 飞 。 比 如 他 说 parallel processing(并行处理)的时候,两个 P 会拉得很长, 第一排的学生又能感觉到,“天啊,又下雨了!”
语音 识 别
“什么是做博士的目的?”在我选定研究方向,
正准备 挽起袖 管大干 一番 的时候 ,我们 的院 长尼 科·海博曼问了我这个问题。我想都没想,脱口而 出,“就是在某一个领域做出重要的成果。“”不对。” 尼科·海博曼教授不假思索地否定了我。他告诉我, “读博士,就是挑选一个狭窄并重要的领域作研究, 毕业的时候交出一篇世界一流的毕业论文,成为这 个领域里世界首屈一指的专家。任何人提到这个领 域的时候,都会想起你的名字。”
海博曼教授的“做世界某一个领域的一流”的 观点,让我十分震惊,我从未奢望在 20 多岁时走到 某个领域的顶峰,但是这种“要做就要做到最好” 的激励,我始终铭记在内心深处。
看到了我的兴奋,海博曼教授问我:“你懂了吗?” 我说:“懂了,我从卡内基·梅隆大学将带走的就是 这份改变世界的、顶尖的博士论文。”他又说:“不 对,你从学校带走最有价值的不是这份论文,而是 你分析和独立思考的能力、研究和发现真理的经验, 还有科学家的胸怀。当你某一天不再研究这个领域
的时候,你依然能在任何一个新的领域做到最好。”
这番话引起了我深深地思索,也再一次印证了“沉 淀下来的才是教育”这句话的意义。学习成绩只是 一种表象的结果,而学习能力才是伴随一生的能力。
1983 年 10 月,我走进语音识别的世界。开始 和瑞迪教授一起探讨语音识别领域里现有的成果以 及如何突破的可能性,瑞迪说,“你来做一个不特定 语者的语音识别系统吧。”当时这在世界上是一个无
解之谜。
所谓不特定语者的语音识别就是说让电脑能够 听懂每一个人说出的话,并且识别出来,最后希望 达到的最理想状态就是让机器对人的语言有所反应, 最终达到“人机对话”的理想程度。在我当时所处 的年代,人们所做的语音识别系统研究,还只能识 别一个人的声音,也就是“特定语者”的研究。因 此,瑞迪教授对我的期望就是让我把这个研究成果 扩展出来,形成突破,让机器对更多的人的语言识 别率提高。
瑞迪告诉我,“我觉得专家系统是解决不特定语
者问题最好的方法,这也是最火的新技术。希望你
试试。去吧,小伙子,尽情做你的研究,我这里有 科学基金的研究经费,因此你不用担心钱的问题。” 在巨大的期望下,瑞迪把课题的接力棒交给了我。
经过数月的钻研,我把整个研究过程写了篇论 文发表出来,得到了正面的回馈。第一次,人们知 道,在有限的领域和单一的语者身上,专家系统研 究出来的机器语音识别率可以达到 95%。这意味着, 人和机器可以进行简单的对话了。那段时间,瑞迪 开心得不得了,并且更加坚信“专家系统”的方法 是个正确的选择。
尽管面对一片好评,我却显得非常沉默。其实, 这个时候我内心的担忧早已开始慢慢滋长了。因为, 在研究的过程中,我已经发现专家系统的前景非常 不明朗,因为机器经过很长时间的训练,只能听懂
特定 20 个训练者的语音。而人与人说话的音节和语 调千变万化,只要换了另外 100 人的声音重新检验 原来的研究成果,其识别率立即下降到不能想象的 地步,只有 30%左右。而且,我们仅仅用了 26 个
词作为词汇,一旦增加词汇,整个系统就将崩溃。
1984 年暑假即将来临,我正沉浸在自己课题的 十字路口上,不知道何去何从。这个时候我遇到了 我的一个师兄彼得·布朗(Peter Brown),他看到我 愁眉不展,就把我叫到一间教室里,在黑板上写了 几个统计学公式。彼得·布朗对我说,“开复,我知 道你在做语音识别,并且为之苦恼,但是你为什么 不尝试一下统计学的方法呢,从统计中抽取数据我 想应该能够提高语音识别率,你觉得呢?”
所谓统计学的方法,就是从庞大的数据库中进 行归类,通过特征的归纳使得数据通过“分类器”, 得到结果的一种方法。对于是否能用大量数据库对 声音进行统计,我心中充满了好奇与问号。而用统 计学方法来研究语音识别的想法,开始在心中慢慢
地滋生。
李老 师 的催 眠 术
在课题研究正徘徊不前时,我迎来了 l984 年的
暑假。当时,我在学校论坛上看到了一个暑期工的 项目,内容就是为宾夕法尼亚州 60 个最聪明的高中 生教授计算机课程。教 6 个星期的课程可以得到 3
000 美元,这对于当时每个月只有 700 美元奖学金 的我来说,是一个绝对有诱惑力的岗位。最重要的 是,我不但可以获得一些教学经验,还可以在语音 识别之外涉猎一个新的领域,真是一箭双雕的难得
机会。
我非常享受那段时光。每天 8 点整,我准时出 现在教室里,滔滔不绝,板书从左边一直写到右边, 写到挤不下为止。我热情地帮这些“天才高中生” 设计各种作业,备课时准备了厚厚的一叠笔记,我 要用几个星期的时间,让他们完成大三一年的计算
机课程。
我把 60 个人分成 8 个小队,每个小队开发自己
的奥赛罗(也称黑白棋)下棋算法,然后两两进行比 赛,一直到决出冠亚军。到课程结束,我发现班里 的每一个人都学会了写程序,这个成果后来还展示
给宾州的州长看,并且得到了好评,做教师的成就
感油然而生。
暑假尾期,我去系主任那里拿我的 3 000 美元 “巨款”。结果发现“老板”那里有一叠厚厚的报告, 我随口问了一句,“老板,你那厚厚的一叠东西是什
么啊?”系主任慢悠悠地回答,“噢,就是暑期宾州 学生对老师的评估。”“噢,那可不可以让我看看?” 我立刻对这个报告充满了好奇。系主任的脸色忽然 变得尴尬起来,“开复,你还是不要看的好。”“为什 么?”这个时候,我忽然从系主任游离的目光中感觉 到了什么。在软磨硬泡之下,我还是坚持从“老板” 那里要来了这份报告,而看到学生的打分让我“大 跌眼镜”。
打分是五分制,其他科目的老师得到的一般是
3~4 分,我居然只有 1 分一个学生在评语里写道: “李开复的课程太枯燥了。也许内容并不差,但是 经过他的诠释,实在让我们受不了。”“他上课的时 候,从来没有看过我们的眼睛。只有他一个人在表 演。我们给他的课取了个名字,叫做‘开复剧场’。”
还有学生写道“,李老师的语气单调,就像念经一样,
有着强烈的催眠作用。就算我昨晚睡够了,终究还 是敌不过李老师的催眠术。”
看着这些评语,我脸红心跳,让我觉得这次暑 期课程,如同一场噩梦。我的演讲能力和沟通能力 这么差,我竞全然不知。而他们 60 个人都能学会编 程,并不是我教得好,而是他们本身就是天才。那 些上课睡觉的学生,我以为他们困了,其实是被我 施行了催眠术。
每个读博士的人,都可能把做教师作为一种职 业的选择。我显然不是一个好老师。我忽然感觉, 教师这种职业可能不适合我。我该怎么办?放弃吗? 不。我决心突破自己的瓶颈,直击软肋。著名的哲 学家伯里克利(Pericles)曾说过,“一个有思想,但 是不能表达的人,如同自己没有思想。”而我欠缺表 达,如同扼杀了自己的思想,这是理 T 科学生不能
忍受的。
我开始向系里知名的教授请教教学的技巧:如 何才能做一个好的演讲者,如何使自己的话更加吸
引人。而他们也给了我很切实的帮助,比如“不要
做你没有兴趣的演讲”“演讲前,练习三遍,一定要 录音,最好录像”“随机地去看观众的眼睛,接触 3~
5 秒”“如果你害怕,就看坐在最远处的观众的头顶, 因为他们也分不清你在看哪里”。当然,这些理论实 践起来,还是“知易行难”。不过,从那以后,我努 力争取各种演讲的机会,克服自己的心理障碍,尽 量做一个好的沟通者。
如今,我在各个学校里作巡回主题演讲,每年
至少 25 场,至少面对 l0 万名学生。当年那个羞涩、 内向、恐惧的小伙子已经不复存在。这还得感谢那 个暑假的尴尬经历。它让我认清了自己,并让我勇 于挑战自己。
战胜 世 界冠 军
1984 年 8 月底,结束了“开复剧场”的表演, 通过这一次的教学,我也开始关注计算机对弈这个
领域了。
奥赛罗是一种类似于五子棋的两人对弈游戏,
棋盘为 8 X 8,开盘时,棋盘正中共有 4 粒棋子, 呈对角线排列,两白两黑,由执黑者先行。写对弈 程序的时候,就是要教电脑往后推算,一般来说, 机器能够分析五六步,就感觉下得不错了。
在我教的天才班里,我认识了萨卓依·玛哈俊 (Sanjoy Mahajan),他是暑期班里的第一名,可以 说是“天才当中的天才”。他设计了很多种不同的算 法,将原来只有 400 行的程序增加到两万行,把五 层的推算搜索增加到了七层,我决定带着他一起继 续在“奥赛罗”上努力。
那一年,我 23 岁,我的“学生”萨卓依·玛哈 俊 16 岁。下课后,他就跟我一起沉浸在“奥赛罗” 的运算里,晚上,我带他到我家去吃饭,吃完饭我 们又冲回学校继续作研究。我们把统计的方法做进 “奥赛罗”里,虽然困难超过了我们的想象,但是 成功也超过了我们的想象:最后,“奥赛罗”的运算 比以前快了 l 000 倍,最多能够完整搜完 l4 层(就
是推算下面所有 l4 步棋的排列与组合,在还有 l4
步棋没有下时就能精确地预测输赢)。
将统计学应用于奥赛罗棋,通俗来说,就是将 过去的棋谱输入电脑,把所有输棋的选择都归纳成 “输”,赢棋的都归纳成“赢”,然后再做一个“分 类器”来分辨输赢。我们共同下出了 4 万盘完全不 同的棋谱,每一谱走 60 步,这样,我们得到了 240 万步不同的走法,每一步都定义成最终“黑赢”或 者“白赢”,还精确地统计出赢的概率。到这个时候, 每走一步棋,机器就能推算出之后 l4 步的走法,并 准确判定赢的概率。比如刚开始你赢的概率是 51%, 再走一步,就可能是 48%,如果走错了一步棋,那 么它会告诉你,赢的概率是 5%。
精确的统计学使得我们的“奥赛罗”机器人无 可匹敌。我把这