今年主要做了这么几件事:科研实习、探索新方向、申请PhD。
Mac OS Sonoma 14.6 ClashX 无法访问~/.config的解决方案
发表于
阅读次数:
本文字数: 984 阅读时长 ≈ 1 分钟
本文字数: 984 阅读时长 ≈ 1 分钟
Mac OS 14.6 的文件夹访问权限变严了,导致clashX无法访问~/.config
设置代理文件。
[论文阅读:NeurIPS 2024 Best Paper] Stochastic Taylor Derivative Estimator: Efficient amortization for arbitrary differential operators (Part 1)
发表于
阅读次数:
本文字数: 2.5k 阅读时长 ≈ 2 分钟
本文字数: 2.5k 阅读时长 ≈ 2 分钟
我没有做过automatic differentiation这一方向。论文阅读嘛,就是要走出舒适区,拓宽认知边界的。这一篇以学习前置知识为主。
学习笔记:直接偏好优化(Direct Preference Optimization)原理
DPO是一种语言模型(language model)的后训练算法,无需使用RL而使之输出与人类偏好对齐。
WWW 2024 | 重剑无锋:个性化学习者能力建模全新范式:通用的可识别、可解释的能力诊断框架
发表于
更新于
阅读次数:
本文字数: 7.4k 阅读时长 ≈ 7 分钟
本文字数: 7.4k 阅读时长 ≈ 7 分钟
个性化学习者能力建模全新范式。
2023年一次USTC国际差旅学生报销记录
发表于
更新于
阅读次数:
本文字数: 1.3k 阅读时长 ≈ 1 分钟
本文字数: 1.3k 阅读时长 ≈ 1 分钟
将这次报销过程记录下来,以供后人参考
骑行随想
一些日常。
推荐系统中的用户行为建模综述【IJCAI'22论文阅读】
本文为IJCAI’22综述论文 _A Survey on User Behavior Modeling in Recommender Systems_ 阅读笔记。
一次美国学术会议签证经历(2023)
一次美国学术会议面签经历。
A Study Note of Game Theory.1
An introduction to game theory.