百度笔试题(第一套题)
一:编程题
现有一组共计 个固定的集合( 为万量级),每个集合有个从 开始递增的集合 ,每
个集合包含 个 ( 为 的量级),希望设计一个程序能够持续对外服务,
输入是一个 数组,输出其中任意一个集合 (如果该 数组包含该集合的所有
),如果找不到输出。要求:
, 时间复杂度最优,能够在短时间内对大量输入逐个输出
, 实现具体的代码(可以是伪代码),其中常用的数据结构可以采用标准库。
, 给出时间复杂度和空间复杂度。
组合集合的文件格式举例:
空格
空格
空格
输入的为 数组(说明: 为一个词,可能是中文,固定字符串表示)
二:算法题
你现在有一个文件,文件中顺序存有 个记录,这些记录不是有序的,但是你
知道一个整数 这些记录满足 以及
设计一个算法或编写一个程序,将文件中的记录排序为 算法或程序读取
文件的次数为 不限内存使用,
设计一个算法或编写一个程序,将文件中的记录排序为 算法或程序读写文
件的次数为 ,空间复杂度为 ,亦即,你使用的内存大小和 均无关。
三:系统设计题
网络上所有的链接都可以用以下的三元素进行描述:
!(链接所在页面的 "#)
$ !(链接所指向的 "#)
%&'((链接在页面上所显示的内容)
现在假设所有的网页链接信息() !*$ !*%&'()按 ) ! 为轴都存储在 个
(:+ 以内)巨型数据库中:
, 链接存储形式:) !$ !%&'(;
, 一个 ) ! 的所有的 $ ! 都存储在同一个数据库中;
, 假设每个数据库存储的数据量相同
, 要求设计一个获取所有链接分发程序,将这些数据均匀分发到 个远程数据库中
(, 以内)要求做到: 所有 $ ! 相同的链接需要分到同一个远程数据库, 所有
$ ! 的站点相同的需要分发到同一个远程数据库, 每个远程数据库获取的链接总数要尽
量均匀, 每台数据库完成时间尽量保持一致 -,获取网页的速度尽量快(从数据库中)
说明:对于 !:(./,00/1%23 '04$&51%23 /,其中 /1%23 ' 属于站点信息。
百度笔试题(第二套题)
一:算法题
有一段文本,由英文字母、阿拉伯数字、67 编码的中文字符和一些常用标点符号(假
设只包含全0半角的逗号和句子)组成。请写出程序,统计这段文本中每个字的出现次数,
对“字”的定义如下:,连续的英文字母或者阿拉伯数字,例如 %1 或 ,但最长不超过
个字符;,包含不超过一个半角句点的两段连续数字,例如 ,但最长不超过 个
字符 ,单个汉字
二:开放性题目
%//2&8 是进行快速 9:1 开发经常使用到的技术,请设计一个简单的 %//2&8 框架,
评论0
最新资源