FWEnoir - Nostr Hypermedia

FWEnoir

fwenoir@snort.social

npub1p5ge...fwt7

隨手筆記 / AI / LLM / Golang / Flutter / Software Engineering / 台灣 / Taiwan

fwenoir 2 years ago

蠻好奇目前 Threads 的 DAU，玩了幾天後發現都是網紅佔據版面。

fwenoir 2 years ago

RealChar 是一個即時 AI 角色/伴侶創建和對話的平台，使用最新的 AI 技術，如 OpenAI GPT3.5/4、Anthropic Claude 2、Chroma、Whisper 等。它具有易於使用、可自定義、實時交流和多平台支持等特點。用戶可以在 Web、終端和移動設備上與 AI 角色進行交流。該項目使用了多種技術，包括 Vanilla JS、WebSockets、Swift、FastAPI、SQLite、Docker 等。要使用此應用程序，您需要獲取 OpenAI API 令牌、Anthropic API 令牌（可選）、Google Cloud API（可選）和 ElevenLabs API 密鑰。詳細的安裝和配置說明可以在 GitHub 頁面上找到[1]。 Citations: [1]

GitHub - Shaunwei/RealChar: 🎙️🤖Create, Customize and Talk to your AI Character/Companion in Realtime (All in One Codebase!). Have a natural seamless conversation with AI everywhere (mobile, web and terminal) using LLM OpenAI GPT3.5/4, Anthropic Claude2, Chroma Vector DB, Whisper Speech2Text, ElevenLabs Text2Speech🎙️🤖

🎙️🤖Create, Customize and Talk to your AI Character/Companion in Realtime (All in One Codebase!). Have a natural seamless conversation with ...

fwenoir 2 years ago

#meme #linux

fwenoir 2 years ago

中國的出口在過去三年中下降最快，全球經濟疲軟。2023年7月13日，中國上個月的出口下降速度自COVID-19大流行爆發三年來最快，全球經濟不景氣對中國政策制定者施加了越來越大的壓力，要求出台新的刺激措施。中國海關局週四公布的數據顯示，6月份出口同比下降12.4%，超過預期，繼5月份下降7.5%之後。進口同比下降6.8%，比預期的4.0%下降幅度更大，也比上個月的4.5%下降幅度更大。中國經濟學家黃子春表示，全球商品需求的下滑將繼續拖累出口，預計出口在年底前將進一步下降。然而，她補充說，“好消息是，外需下降的最壞時期可能已經過去。”中國海關總署發言人呂大亮在北京的一場新聞發布會上將出口表現不佳歸咎於“全球經濟復蘇疲軟、全球貿易和投資放緩以及單邊主義、保護主義和地緣政治上升”。 Citations: [1] https://www.reuters.com/markets/asia/chinas-june-exports-fall-124-imports-drop-68-2023-07-13/#:~:text=China%27s%20exports%20fall%20most%20in%20t

fwenoir 2 years ago

中國監管機構於周四確定了首個針對生成式人工智能的規則，以加強對這一快速發展技術的監管。中國國家網信辦（CAC）表示，它與幾個其他監管機構共同制定了這一新規定，將於8月15日生效。生成式AI是一個快速發展的技術領域，人工智能服務能夠生成文本或圖像等內容。美國公司OpenAI開發的ChatGPT是最知名的例子，用戶可以向聊天機器人發送提示並獲得回答。然而，ChatGPT的成功引發了一波競爭對手的出現，引起全球監管機構對這一技術潛在風險的擔憂。中國的科技巨頭紛紛加入這一領域，宣布計劃並推出自己的生成式AI服務。但中國通過審查和監管嚴格控制國內互聯網，對AI發展保持密切關注。中國監管機構擔心這些服務可能產生與北京觀點或意識形態相悖的內容。這也是為什麼中國科技公司在推出類似ChatGPT的服務時謹慎行事。與其向公眾廣泛提供的完整服務，中國公司更專注於企業和狹窄用途的技術。例如，阿里巴巴本月推出了一款名為“同一萬象”的人工智能工具，該工具可以根據提示生成圖像，但僅向企業客戶提供測試。然而，CAC的規則為科技巨頭在這一技術方面提供了一個合作框架。中國的生成式AI規則僅適用於向普通公眾提供的生成式AI服務，而不適用於研究機構等開發的服務。CAC表示，生成式AI服務需要獲得營業許可。如果生成式AI服務提供商發現“非法”內容，應采取措施停止生成該內容，改進算法，然後將該材料報告給有關部門。這些服務的提供商必須對其產品進行安全評估，確保用戶信息安全。中國的生成式AI服務還必須遵循“社會主義核心價值觀”。監管機構正努力在使中國成為人工智能領導者與密切關注其發展之間取得平衡。CAC的規則表示，該法規旨在鼓勵生成式AI的創新應用，支持與半導體等相關基礎設施的發展[1]。 Citations: [1]

China finalizes first-of-its-kind rules governing generative A.I. services like ChatGPT

Chinese regulators on Thursday said it finalized first-of-its-kind rules governing generative artificial intelligence which will come into effect o...

fwenoir 2 years ago

這篇文章講的是大型語言模型(LLM)應用程式開發的參考架構。主要的觀點如下: - LLM是一種強大的新基礎,可以用來建構軟體。但因為它們非常新的,使用方式也和傳統運算資源不同,所以不容易理解如何使用。 - 文中提出了一個LLM應用程式參考架構。它顯示了AI新創公司和大公司常見使用的系統、工具和設計模式。 - 目前比較流行的設計模式是"文脈內學習"。就是使用現成的LLM,通過巧妙的提示和私人"文脈"資料調整它們的行為。 - 參考架構把流程分為三個階段:1) 資料預處理/嵌入 2) 提示構建/檢索 3) 提示執行/推理。 - 提到了每個階段常見使用的工具,包括Databricks、OpenAI API、Pinecone、LangChain等。 - 也討論了一些開發人員面臨的選擇,例如專有vs開源LLM,以及代理框架的發展。 - 總體來說,這份參考架構是LLM應用程式開發早期階段的有用指南。隨著基礎技術的進步,它可能會發生重大改變。

Andreessen Horowitz

Emerging Architectures for LLM Applications | Andreessen Horowitz

A reference architecture for the LLM app stack. It shows the most common systems, tools, and design patterns used by AI startups and tech companies.

fwenoir 2 years ago

根據這篇文章,以下是關於GPT-4的一些關鍵信息: - GPT-4采用了稀疏模型架構,而不是密集的變換器模型架構。這樣可以減少參數量並提高推論效率。 - GPT-4總參數量大約為1萬億,遠超過GPT-3的1750億參數。 - GPT-4使用了混合精度訓練,可以加速訓練速度並減少訓練成本。 - GPT-4使用了專門的視覺編碼器進行多模態訓練,可以處理圖像輸入。 - GPT-4使用了大量的並行計算技術,如數據並行、模型並行等,以加速訓練。 - GPT-4訓練資料集包含了大量網絡文本、書籍、代碼等內容。 - GPT-4在推理時使用了單芯片和多芯片的並行技術,並進行了針對性優化,以實現快速響應。 - GPT-4代表了語言模型規模和模型架構的重大進步,將推動AI assistants和其他應用的發展。這篇文章總結了GPT-4在模型架構、訓練和推理方面的創新之處,以及超大模型訓練的工程挑戰和解決方案。GPT-4代表了語言模型發展的新方向。 https://www.semianalysis.com/p/gpt-4-architecture-infrastructure

fwenoir 2 years ago

Claude 2 發表了

X (formerly Twitter)

Anthropic (@AnthropicAI) on X

Introducing Claude 2! Our latest model has improved performance in coding, math and reasoning. It can produce longer responses, and is available in...

fwenoir 2 years ago

更多GPT-4的資訊 View quoted note →

fwenoir 2 years ago

下班 #catstr

fwenoir 2 years ago

未來親子週刊│未來親子學習平台

AI浪潮席捲，家長們「重理輕文」，資工系教授：並非讀了資工系對未來就有保障，如果孩子喜歡做蛋糕，就別逼他走理工

AI一日千里，為人類社會帶來巨變，未來人才的具體樣貌為何？擁有哪些能力、特質，才能不畏挑戰、從容迎接A...

fwenoir 2 years ago

東映日前對外宣布，宮崎駿的最後一部電影《你想活出怎樣的人生》確認會提供 IMAX、杜比影院、杜比全景聲和 DTS:X 版本。這將是吉卜力工作室首度以 IMAX 形式呈現自己的作品，而這無疑會給觀眾多一個走入影院的理由。可是07/21有奧本海默耶，會不會一下就從IMAX下檔啊。

fwenoir 2 years ago

北科熱炒白飯事件懶人包近日，台北市知名熱炒店「大道創意料理快炒」發生了一起北科大學生吃光白飯並刷負評的事件[1]。事件起因是該店在用餐時段湧入30多名學生，結果把店內兩桶白飯吃光還抱怨吃不夠，店家要求點炒麵時卻被拒絕，一行人甚至到店家洗1星負評，讓老闆感到非常無奈[1]。事後，該群大學生被起底發現是北科大的學生，北科資財營籌備團隊總召便出面回覆，表示學生實際上吃到的飯量根本不足兩鍋，對於至店家的google評論留下1顆星的評價，聲明表示「我們並無誇大其詞，所留下的言論也都是真實遭遇，用餐者有留言評論的權利，我們覺得這並無不妥！」沒想到卻被網友砲轟到刪文[1]。 7月9日晚間，北科大資財營籌備團隊前往熱炒店向老闆致歉，並且發出與老闆合影表示「抱歉造成了大家的困擾，我們已經親自前往大道創意料理熱炒致歉，也和老闆解開了誤會！在店家的評論下刷負評確實是我們的錯，沒有和店家先說好也是我們的問題，感謝大家對此事的關心，我們會記取這次深刻的教訓。」[1] 網友們對於這起事件的看法不一，有人認為學生錯在「集體刷1星」[2]，也有人認為學生應該修禮貌通識課，提高道德人品[3]。總之，這起事件引發了廣泛的討論，也讓人們反思在網路評論中應該如何表達自己的意見。 Citations: [1] https://tw.news.yahoo.com/%E5%8C%97%E7%A7%91%E5%A4%A7%E5%AD%B8%E7%94%9F%E5%90%83%E5%85%89%E7%99%BD%E9%A3%AF%E5%88%B7%E8%B2%A0%E8%A9%95-%E5%A4%9C%E8%A1%9D%E7%86%B1%E7%82%92%E5%BA%97%E9%81%93%E6%AD%89-232534673.html [2]

三立新聞網

北科大學生到底「錯在哪」？鄉民：錯在集體刷1星 | 生活 | 三立新聞網 SETN.COM

北科大學生與熱炒店的「白飯事件」延燒至今，儘管北科學生已經發出聲明道歉，也親自向店家致歉，仍無法停...

[3]

北科大生吃光白飯狂洗1星發聲明遭轟秒刪文

台北市知名熱炒店，7月8日有超過30名學生用餐，把兩大桶白飯吃光，因為店家來不及準備，就狂刷一星負評，�...

fwenoir 2 years ago

#meme

fwenoir 2 years ago

#movie #moviestr

X (formerly Twitter)

Psyche Wizard (@PsycheWizard) on X

10 Netflix movies that will change your life + mindset: 1.

fwenoir 2 years ago

"Lost in the Middle: How Language Models Use Long Contexts" investigates the performance of language models in utilizing long input contexts. The study focuses on multi-document question answering and key-value retrieval tasks that require language models to identify and use relevant information within their input contexts. The analysis reveals that language models tend to perform better when the relevant information is located at the beginning or end of the input context but struggle when accessing relevant information in the middle of long contexts. The research also finds that as the input context becomes longer, model performance decreases, even for models designed for long-context processing. The document provides insights into how language models use their input contexts and suggests new evaluation protocols for future models. It includes experiments with open and closed language models and investigates the impact of model architecture, query-aware contextualization, and instruction fine-tuning. A case study on open-domain question answering with retriever-reader models highlights the trade-off between adding more information to the input context and the model's ability to reason effectively over it. Overall, the research sheds light on the limitations and challenges of language models in effectively utilizing long input contexts for various tasks。 #chatgpt #AI #LLM

Lost in the Middle: How Language Models Use Long Contexts

While recent language models have the ability to take long contexts as input, relatively little is known about how well they use longer context. We...

fwenoir 2 years ago

#meme

fwenoir 2 years ago

A tweet has compiled some usage tips for the ChatGPT Code Interpreter. #chatgpt

X (formerly Twitter)

Chase Lean (@chaseleantj) on X

The biggest compilation of what ChatGPT Code Interpreter can do Code Interpreter is hands down the most powerful version of ChatGPT. I spent 3 ho...

fwenoir 2 years ago

小孩學會玩躲貓貓後真好，直接開始手機滑起來。

fwenoir 2 years ago

TNL The News Lens 關鍵評論網

《拒看新聞的生活藝術》：新聞讓你變成一個膚淺的思考者，還會損害你的記憶 - TNL The News Lens 關鍵評論網

思考需要專注力。而新聞卻是要盡可能地讓你分心，這便是其商業模式運作的方式。造訪每一個新聞網頁，都是...

Load More →

↑