Commits · 3bc28736cd3eec7c7fcc4981ebfef5c36e4bdd7d · OpenDAS / ollama

22 Jan, 2024 9 commits
- Merge pull request #2143 from dhiltgen/llm_verbosity · 3bc28736
  Daniel Hiltgen authored Jan 22, 2024
```
Refine debug logging for llm
```
  3bc28736
- Merge pull request #2142 from dhiltgen/debug_on_fail · a0a829bf
  Daniel Hiltgen authored Jan 22, 2024
```
Debug logging on init failure
```
  a0a829bf
- Refine debug logging for llm · 730dcfcc
  Daniel Hiltgen authored Jan 22, 2024
```
This wires up logging in llama.cpp to always go to stderr, and also
turns up logging if OLLAMA_DEBUG is set.
```
  730dcfcc
- Debug logging on init failure · 27a2d5af
  Daniel Hiltgen authored Jan 22, 2024
  
  27a2d5af
- update submodule to `6f9939d` (#2115) · 5f81a33f
  Jeffrey Morgan authored Jan 22, 2024
  
  5f81a33f
- Merge pull request #2102 from jmorganca/mxyng/fix-create-override · 6225fde0
  Michael Yang authored Jan 22, 2024
```
fix: remove overwritten model layers
```
  6225fde0
- readline: drop not use min function (#2134) · 06918456
  Meng Zhuo authored Jan 23, 2024
  
  06918456
- Merge pull request #2130 from dhiltgen/more_faster · 5576bb23
  Daniel Hiltgen authored Jan 21, 2024
```
Make CPU builds parallel and customizable AMD GPUs
```
  5576bb23
- Merge pull request #2131 from dhiltgen/probe_cards_at_init · 27388377
  Daniel Hiltgen authored Jan 21, 2024
```
Probe GPUs before backend init
```
  27388377
21 Jan, 2024 5 commits

Probe GPUs before backend init · ec376453

Daniel Hiltgen authored Jan 21, 2024

Detect potential error scenarios so we can fallback to CPU mode without
hitting asserts.

ec376453

Make CPU builds parallel and customizable AMD GPUs · df54c723

Daniel Hiltgen authored Jan 21, 2024

The linux build now support parallel CPU builds to speed things up.
This also exposes AMD GPU targets as an optional setting for advaced
users who want to alter our default set.

df54c723

Merge pull request #2127 from dhiltgen/rocm_container · fa8c990e
Daniel Hiltgen authored Jan 21, 2024
```
Combine the 2 Dockerfiles and add ROCm
```
fa8c990e

Combine the 2 Dockerfiles and add ROCm · da72235e

Daniel Hiltgen authored Jan 21, 2024

This renames Dockerfile.build to Dockerfile, and adds some new stages
to support 2 modes of building - the build_linux.sh script uses
intermediate stages to extract the artifacts for ./dist, and the default
build generates a container image usable by both cuda and rocm cards.
This required transitioniing the x86 base to the rocm image to avoid
layer bloat.

da72235e

Unlock mutex when failing to load model (#2117) · 89c4aee2
Jeffrey Morgan authored Jan 20, 2024

89c4aee2

20 Jan, 2024 2 commits
- increase minimum overhead to 1024MiB (#2114) · f32ea81b
  Jeffrey Morgan authored Jan 20, 2024
  
  f32ea81b
- sign dylibs on macOS (#2101) · 4c54f0dd
  Jeffrey Morgan authored Jan 19, 2024
  
  4c54f0dd
19 Jan, 2024 10 commits
- fix: remove overwritten model layers · c08dfaa2
  Michael Yang authored Jan 19, 2024
```
if create overrides a manifest, first add the older manifest's layers to
the delete map so they can be cleaned up
```
  c08dfaa2
- Merge pull request #2100 from dhiltgen/more_wsl_globs · 3b76e736
  Daniel Hiltgen authored Jan 19, 2024
```
More WSL paths
```
  3b76e736
- More WSL paths · 552db98b
  Daniel Hiltgen authored Jan 19, 2024
  
  552db98b
- Merge pull request #2099 from dhiltgen/fix_cuda_model_swap · fdcdfef6
  Daniel Hiltgen authored Jan 19, 2024
```
Switch to local dlopen symbols
```
  fdcdfef6
- Switch to local dlopen symbols · 6a042438
  Daniel Hiltgen authored Jan 19, 2024
  
  6a042438
- use `gzip` for runner embedding (#2067) · dc88cc39
  Jeffrey Morgan authored Jan 19, 2024
  
  dc88cc39
- Merge pull request #1999 from lainedfles/termux_android_cpu_only · 62976087
  Daniel Hiltgen authored Jan 18, 2024
```
Fix CPU-only build under Android Termux enviornment.
```
  62976087
- Restore dyn_ext_server.c since RTLD_DEEPBIND has been removed · 344342ab
  Self Denial authored Jan 18, 2024
  
  344342ab
- Fix CPU-only build under Android Termux enviornment. · eb76f3e3
  Self Denial authored Jan 15, 2024
```
Update gpu.go initGPUHandles() to declare gpuHandles variable before
reading it. This resolves an "invalid memory address or nil pointer
dereference" error.

Update dyn_ext_server.c to avoid setting the RTLD_DEEPBIND flag under
__TERMUX__ (Android).
```
  eb76f3e3
- Merge pull request #2060 from jmorganca/mxyng/fix-show · d017e3d0
  Michael Yang authored Jan 18, 2024
```
fix show handler
```
  d017e3d0
18 Jan, 2024 14 commits
- fix show handler · aac9ab4d
  Michael Yang authored Jan 18, 2024
  
  aac9ab4d
- Merge pull request #1932 from jmorganca/mxyng/api-fields · 1f5b7ff9
  Michael Yang authored Jan 18, 2024
```
api: add model for all requests
```
  1f5b7ff9
- Merge pull request #1958 from purificant/ci · e299831e
  Michael Yang authored Jan 18, 2024
```
ci: update setup-go action
```
  e299831e
- add model to ModelResponse · 745b5934
  Michael Yang authored Jan 18, 2024
  
  745b5934
- api: add model for all requests · a38d88d8
  Michael Yang authored Jan 11, 2024
```
prefer using req.Model and fallback to req.Name
```
  a38d88d8
- Merge pull request #2056 from dhiltgen/slog · abec7f06
  Daniel Hiltgen authored Jan 18, 2024
```
Mechanical switch from log to slog
```
  abec7f06
- Merge pull request #2020 from jmorganca/mxyng/install-fedora · e5da190b
  Michael Yang authored Jan 18, 2024
```
install: pin fedora to max 37
```
  e5da190b
- Go bump to v1.21 to pick up slog · ecbfc018
  Daniel Hiltgen authored Jan 18, 2024
  
  ecbfc018
- Mechanical switch from log to slog · fedd705a
  Daniel Hiltgen authored Jan 18, 2024
```
A few obvious levels were adjusted, but generally everything mapped to "info" level.
```
  fedd705a
- add open interpreter to list of extensions (#2016) · 82ee019b
  Mike Bird authored Jan 18, 2024
  
  82ee019b
- Haystack Ollama Integration (#2021) · ad9dbc2a
  Sachin Sachdeva authored Jan 18, 2024
```
Updated readme with the web link for haystack ollama integration
```
  ad9dbc2a
- Merge pull request #1987 from xyproto/archlinux · fccdf4c6
  Daniel Hiltgen authored Jan 18, 2024
```
Let gpu.go and gen_linux.sh also find CUDA on Arch Linux
```
  fccdf4c6
- Merge pull request #2055 from dhiltgen/cuda_docs · d450fb1d
  Daniel Hiltgen authored Jan 18, 2024
```
Refine the linux cuda/rocm developer docs
```
  d450fb1d
- Merge pull request #2007 from dhiltgen/cpu_fallback · df40b11d
  Daniel Hiltgen authored Jan 18, 2024
```
Add multiple CPU variants for Intel Mac
```
  df40b11d