AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@ ...
Krapivin的研究突破性地推翻了姚期智长达40年的哈希表性能猜想,提出了更高效的哈希表设计,显著提升了查询和插入操作的速度,并可能在数据库、缓存系统、编译器、网络路由和密码学等领域带来深远影响。
姚期智教授之前推断“对于具有某些“贪婪”插入属性的哈希表,其平均查询时间存在 O (log 𝑥) 的理论下限”。而克拉皮文团队通过引入 非贪婪插入策略 , 推翻了这样的限制条件。 他们证明,他们所提出的新型哈希表能够实现 与负载系数 𝑥 ...
浙江汇隆新材料股份有限公司,一家专注于原液着色涤纶长丝智能制造的领先企业,近日宣布对 Ambercycle进行 500 万美元的战略投资。此次合作体现了双方在绿色纤维创新领域的共同承诺,计划携手扩大 T2T 原液着色涤纶长丝的生产能力。
文章全面探讨了大语言模型在预训练数据选择上的重要性,并提出了一种名为 DataMan 的数据管理器,用于对预训练数据进行质量评分和领域识别,以优化 LLMs 的预训练过程,本文由浙江大学和阿里巴巴千问 ...
这些方法包括: 1)Uniform:随机选择 ... 建模、任务泛化能力和指令遵循能力上均优于使用均匀采样的基线模型。此外,使用 DataMan 的 13 个质量 ...