Есть вектор 64-битных дробных чисел (например, 4 числа), эти значения можно просто перезаписать. Параллельно - значит либо каким-то образом использовать векторную процессорную инструкцию (не нашёл как именно), либо как-то использовать видеокарту (опять же, как лучше всего?)
Гуглить:
Ну и так далее. Конкретных решений не подскажу, увы, не специалист.