如何定义中文标题的相似度?现需要找出数据库中标题相似的文章,可以如何用SQL语言定义中文标题的相似度?

来源:学生作业帮助网 编辑:作业帮 时间:2024/04/28 10:36:44
如何定义中文标题的相似度?现需要找出数据库中标题相似的文章,可以如何用SQL语言定义中文标题的相似度?

如何定义中文标题的相似度?现需要找出数据库中标题相似的文章,可以如何用SQL语言定义中文标题的相似度?
如何定义中文标题的相似度?
现需要找出数据库中标题相似的文章,可以如何用SQL语言定义中文标题的相似度?

如何定义中文标题的相似度?现需要找出数据库中标题相似的文章,可以如何用SQL语言定义中文标题的相似度?
SQL语句实现按关健字模糊查询,并按匹配度排序
IF OBJECT_ID('TB')IS NOT NULL DROP TABLE TB
GO
CREATE TABLE tb (ID INT IDENTITY(1,1),VALUE NVARCHAR(100))
INSERT tb SELECT N'中国'
UNION ALL SELECT N'中国人'
UNION ALL SELECT N'中国人民'
UNION ALL SELECT N'日本'
UNION ALL SELECT N'日本人'
UNION ALL SELECT N'我的心中有人姑娘'
UNION ALL SELECT N'人民网'
UNION ALL SELECT N'中国是个伟大的国家'
UNION ALL SELECT N'我们都是中国人,都是炎黄子孙,都是龙人传人'
IF OBJECT_ID('fn_SplitStringToROWS')IS NOT NULL DROP FUNCTION fn_SplitStringToROWS
GO
CREATE FUNCTION fn_SplitStringToROWS
(
@str NVARCHAR(100)
)
RETURNS @t TABLE(v NVARCHAR(2))
AS
BEGIN
DECLARE @i INT
SET @i=1
WHILE @i<=LEN(@str)
BEGIN
INSERT @t SELECT SUBSTRING(@str,@i,1)
SET @i=@i+1
END
RETURN
END
GO
SELECT * FROM DBO.fn_SplitStringToROWS(N'中国人')
DECLARE @searchSTR NVARCHAR(20)
SET @searchSTR=N'中国人'
SELECT ID,[VALUE] FROM tb a
INNER JOIN fn_SplitStringToROWS(@searchSTR) b
ON CHARINDEX(b.v,a.VALUE)>0
WHERE VALUE LIKE N'%[中国人]%'
GROUP BY ID,VALUE
ORDER BY COUNT(DISTINCT v) DESC
DROP TABLE tb
/*
v
----



(3 个资料列受到影响)
ID VALUE
----------- ----------------------------------------------------------------------------------------------------
2 中国人
3 中国人民
9 我们都是中国人,都是炎黄子孙,都是龙人传人
6 我的心中有人姑娘
1 中国
8 中国是个伟大的国家
5 日本人
7 人民网
(8 个资料列受到影响)
*/

如何定义中文标题的相似度?现需要找出数据库中标题相似的文章,可以如何用SQL语言定义中文标题的相似度? 如何用matlab从一列数据中找出重复次数最多的数据?需要找出一列数据中重复次数最多的数据以及重复次数,用matlab如何实现? 数据挖掘中如何比较两组高维数据之间的相似度两组数据,分别都有十几个属性;两个数据组有属性重叠,如何用数据挖掘方法计算两组数据的相似度 如何准确的找出相似三角形的对应边 Swissprot数据库如何找出蛋白质的相似序列 如何准确找出相似三角形的对应点 vs2008 如何找出一个函数的声明与定义 如何通过对应边找出相似三角形 相似三角形的定义 相似三角形的定义 一组数据的离散性是如何定义的 需要定义一级标题、二级标题、三级标题和正文的格式,才能够自动生成并插入目录留下联系邮箱 看图找出需要的数据,通过计算解答:两车在什么时间相遇? 看图找出需要的数据,通过计算解答:两车在什么时间相遇? 相似三角形的定义是 格式不同的两张EXCL表,如何找出最后一列相同数据的行 在execl中 测试的数据,获得了一条曲线,如何找出该曲线的公式 sql语句如何写?有一个表table 里面有A,B,C,D四个字段假设表里面有10条数据,字段A为自增的id,B为标题,C为短标题,D为空字段.其中前5条数据(条件已知)标题为空,短标题有数据,后5条短标题为空,