SQL小技巧：随机查询n条数据

李工

1个月前更新

110

在 SQL Server 中随机查询 n 条数据，最常用且简单的方法是使用 ORDER BY NEWID()。以下是几种常见的实现方式及其适用场景：

本文目录 隐藏

1) 方法一：使用 ORDER BY NEWID()（最通用，适用于中小数据量）

2) 方法二：使用 TABLESAMPLE（适用于大数据量，但不够精确）

3) 方法三：高性能随机方案（适用于超大表且需要精确 n 条）

4) 总结建议

方法一：使用 `ORDER BY NEWID()`（最通用，适用于中小数据量）

这是最标准的方法。NEWID() 会为每一行生成一个唯一的 GUID，然后对其进行排序，最后取前 n 条。

SELECT TOP n *
FROM YourTableName
ORDER BY NEWID();

替换说明：将 n 替换为你需要的行数（例如 10），将 YourTableName 替换为你的表名。
优点：语法简单，随机性非常好。
缺点：性能较差。因为它需要为表中的每一行都生成一个 GUID 并进行排序。如果表有数百万行，查询速度会非常慢。

方法二：使用 `TABLESAMPLE`（适用于大数据量，但不够精确）

如果你的表非常大（例如千万级），且对“正好 n 条”或“绝对均匀随机”的要求不那么严格，可以使用 TABLESAMPLE。

SELECT TOP n *
FROM YourTableName
TABLESAMPLE (10 PERCENT); -- 或者指定行数 TABLESAMPLE (1000 ROWS)

注意：
1. TABLESAMPLE 是基于数据页采样的，不是基于行的，所以随机性不如 NEWID() 完美。
2. 它返回的行数是一个近似值。即使你写了 TOP n，如果采样出来的数据本身不足或分布不均，结果可能不符合预期。通常建议结合 TOP 使用以确保不超过 n 条，但无法保证一定能取到 n 条（如果采样范围太小）。
3. 不能用于视图或带有索引的复杂查询某些特定情况。

方法三：高性能随机方案（适用于超大表且需要精确 n 条）

如果表非常大（例如几千万行），使用 ORDER BY NEWID() 会导致超时，可以采用“先随机 ID 再关联”的策略（假设表有自增主键 ID）：

-- 思路：先在一个子查询中随机选出 n 个 ID，然后再关联回原表
SELECT t.*
FROM YourTableName t
JOIN (
    SELECT TOP n ID
    FROM YourTableName
    ORDER BY NEWID()
) AS random_ids ON t.ID = random_ids.ID;

优化点：如果只选择主键列进行 ORDER BY NEWID()，内存消耗会比选择 * 小得多，速度会快很多。然后再通过主键关联回原表获取详细数据。

总结建议

数据量大小	推荐方法	理由
小/中 (< 10万行)	`ORDER BY NEWID()`	代码最简单，随机性最好，性能可接受。
大 (> 100万行)	`JOIN` 子查询法	避免全表排序巨大的开销，仅对主键排序。
超大数据且允许近似	`TABLESAMPLE`	速度最快，但行数不精确，随机分布有偏差。

示例（查询 10 条随机数据）：

SELECT TOP 10 *
FROM Users
ORDER BY NEWID();

评分

欢迎为Ta评分

SQL小技巧：随机查询n条数据

方法一：使用 `ORDER BY NEWID()`（最通用，适用于中小数据量）

方法二：使用 `TABLESAMPLE`（适用于大数据量，但不够精确）

方法三：高性能随机方案（适用于超大表且需要精确 n 条）

总结建议

1数据库安装丨MySQL数据库篇

2纯文本条码-批量打印

3系统部署丨目录

4功能清单

5📺扩展插件丨腾讯发票识别范例

6格式化数值：FORMAT和RIGHT，附WorkFine应用实例